[GoogleML] Setting up Machine Learning
Train / Dev / Test sets
๊ณผ๊ฑฐ - ๊ณ ์ ๋ ๋น์จ์ train / dev / test
ํ์ฌ - ๋น ๋ฐ์ดํฐ ๋ํฅ์ ๋ง์ถฐ, ๋ฅ๋์ ์ผ๋ก ์กฐ์ (1%)
train๊ณผ test set์ ๋ถํฌ๊ฐ ๋์ผํ๋๋ก !
test set? -> develop set์ด ๋ ์ ํฉํ ์ฉ์ด์ด๋ค.
Bias / Variance
bias - ์ค์ฐจ
variance - ์ผ๋ฐํ
high / low variance & bias
train set error๊ฐ ํฌ๋ค -> ์์ง ํ์ต์ด ๋ ๋จ (bias ๋๋ค) more iteration
train์ ๋ฎ์๋ฐ, test error๊ฐ ํฌ๋ค -> ์ผ๋ฐํ ๋ฅ๋ ฅ ๋จ์ด์ง, ์ค๋ฒํผํ ์ํ (variance๊ฐ ๋๋ค)
๋ ๋ค ๋ฎ์ ์ํ๊ฐ ์ ํฉ
๋ ๋ค ํฌ๋ค๋ฉด? ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ๋ถ์ ํฉ
Basic Recipe for Machine Learning
high bias (์ธ๋ํผํ )
- ๋ ํฐ ๋ชจ๋ธ (params) ์ฌ์ฉ
- iteration, ๋ ํ์ต์ํจ๋ค
- or NAS ๋ค๋ฅธ ์ํคํ ์ฒ ์์น
high variance (์ค๋ฒํผํ )
- ๋ ๋ง์ data
- ๊ท์ regularization
- or NAS ๋ค๋ฅธ ์ํคํ ์ฒ ์์น