2023. 9. 29. 21:57ใArtificialIntelligence/2023GoogleMLBootcamp
Orthogonalization
์ด๊ฒ ์ด๋ป๊ฒ ML๊ณผ ์ฐ๊ด์ด ์๋๊ฐ?
Single Number Evaluation Metric
precision (์ ๋ฐ๋)
: cat์ผ๋ก ํ๋ณ๋ ๊ฒ ์ค ์ค์ cat์ ๋น์จ
recall (์ฌํ์จ)
: ์ค์ cat ์ค ์ ๋๋ก ๋ถ๋ฅ๋ ๊ฒ์ ๋น์จ
A์ B์ค ์ด๋ค ๋ถ๋ฅ๊ธฐ๊ฐ ๋ ์ข์๊ฐ?
Satisficing and Optimizing Metric
cost func์ ๋ค์ํ ์๋๋ฅผ ๋ด์ ์ ์๋ค
accuracy - ๋์์๋ก ์ข์ (optimize)
running time - 100ms ์ดํ์ด๊ธฐ๋ง ํ๋ฉด ๋จ (satisfied)
+ ์์ฑ ์ ํธ์ 100ms๋ฅผ ์๋ฏธ!
Train/Dev/Test Distributions
๋ set์ด ๊ฐ์ ๋ถํฌ๋ฅผ ๊ฐ์ง ์ ์๋๋ก
randomly sampling
Size of the Dev and Test Sets
ํ์ง๋ง ํ๋๋ X
When to Change Dev/Test Sets and Metrics?
์๋ก์ด ํ๊ฐ ์งํ๋ฅผ ์ฐพ์๋ณด์์ผ ํ๋ค. evaluation metric
์๋ error metric์ ๋ง์กฑํ์ง ๋ชปํ๋ค๋ฉด, ๋ค๋ฅธ ๋ฉํธ๋ฆญ์ ์๊ฐํด๋ณด์๋ผ
1. ํ๊ฒ์ ์ค์ ํ๊ณ (๋ชฉํ๋ฅผ ์ ํ๊ณ )
2. ๊ทธ ํ๊ฒ์ ์ ๋ง์ถ๋๋ก, ๋ฉํธ๋ฆญ์ ๋ง์ถ๋ค
-> error metric์ ์ํฉ์ ๋ฐ๋ผ ๋ฐ๋ ์๋ ์๋ ๊ฒ!
๊ณ ํ์ง์ ์ฌ์ง์ผ๋ก ํ์ต์์ผฐ์ ๋, A๊ฐ ๋ ์ข์ ์๊ณ ๋ฆฌ์ฆ
๊ทธ๋ฌ๋ ์ ์ ์ ์ฌ์ง์ ํ๋ฆฐ ํ์ง -> B๊ฐ ๋ ์ข์ ์๊ณ ๋ฆฌ์ฆ์ด ๋ ์ ์๋ค
์ด๋ฐ ์ํฉ์์๋ metric์ ๋ฐ๊พธ์
Why Human-level Performance?
๋ฒ ์ด์ฆ ์๋ฌ
x -> y mapping์์ ์ต์ ์ ์๋ฌ
(๋ ์ด์ ์ข์ ๊ฐ์ X)
Avoidable Bias
- ์ฌ๋๊ณผ ์ฐจ์ด๊ฐ ๋ง์ด ๋ ๋ -> ๋ชจ๋ธ ํ์ต ์ฑ๋ฅ์ ๋ ์ฌ๋ฆฌ๊ธฐ ์ํด ๋ ธ๋ ฅ (bias ์ค์ด๊ธฐ)
- ์ฌ๋๊ณผ ์ฐจ์ด๊ฐ ๊ฑฐ์ ์์ ๋ -> ๋ชจ๋ธ ํ์ต ์ฑ๋ฅ์ ๊ฒ์ฆ ๋ฐ์ดํฐ (valid, dev set)๊ณผ ๋ง์ถ๊ธฐ ์ํด ๋ ธ๋ ฅ (์ค๋ฒํผํ ๊ด์ , variance ์ค์ด๊ธฐ)
Understanding Human-level Performance
๋ฒ ์ด์ฆ ์๋ฌ๋ฅผ ์๊ฐํด๋ณด๋ฉด ๋ต์ด ๋์จ๋ค
bayes error == human level error (0.5%)
์ด์ ๊น์ง 0๊ณผ ๋น๊ตํ๋ bias ๋์
bayes error์ ๋น๊ตํ๋ avoidable bias (๋ณด๋ค ํ์ค์ ์ธ ๋น๊ต)
์ด๊ฒ์ด human level error์ ์์ (bayes error์ approximation)
Surpassing Human-level Performance
์ฌ๊ธฐ์ avoidable bias๋? (๋ฒ ์ด์ฆ๋ฅผ ์ ์ํ๋ผ)
๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ด human์ ๋์ด์ ๊ฒฝ์ฐ -> avoidable bias๋ฅผ ์ ์ํ๊ธฐ ์ด๋ ต๋ค
์ฌ๋๋ณด๋ค ML ์ฑ๋ฅ์ด ๋์ ๊ฒฝ์ฐ
- structural data
- not natural perception (์ฌ๋์๊ฒ ์ฉ์ดํ ์์ฐ์ค๋ฌ์ด ์ธ์ง๊ฐ X)
- lots of data (์ฌ๋์ด ํ๋ฒ์ ํ์ ํ๊ธฐ ํ๋ ๋ง์ ๋ฐ์ดํฐ)
Improving your Model Performance
์ด์ ๊ณผ ์ ์ฌํ๊ธด ํ๋ค
- model ์ฑ๋ฅ์ ๋ ๋์ด์ฌ๋ฆฐ๋ค
vs ์ค๋ฒํผํ ๋ฐฉ์ง
'ArtificialIntelligence > 2023GoogleMLBootcamp' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[GoogleML] Transfer Learning & End-to-end Deep Learning (0) | 2023.09.30 |
---|---|
[GoogleML] Error Analysis & Mismatched Train and Test Set (0) | 2023.09.30 |
[GoogleML] Multi-class Classification (0) | 2023.09.23 |
[GoogleML] Hyperparameter Tuning, Regularization and Optimization ์๋ฃ (0) | 2023.09.22 |
[GoogleML] Batch Normalization (0) | 2023.09.21 |