2023. 10. 29. 18:52ใArtificialIntelligence/2023GoogleMLBootcamp
Learning Word Embeddings
blank๋ฅผ ์ฑ์ฐ๋ ๋ฐฉ์ (์์ธกํ๋)
๋ง์ฝ, ๋น์นธ ์์ 4 ๋จ์ด๋ง ๋ณด๊ณ ์์ธกํ๋ค๋ฉด? (์์ i want๋ ์ญ์ , 1800 -> 1200)
context์ ๋ง์ถ์ด (๊ธฐ์ค์ ๋ฐ๋ผ)
ํ๊ฒ์ ์์ธกํ๋๋ฐ ํ์ฉํ ๋จ์ด๊ฐ ๋ฌ๋ผ์ง๋ค.
Word2Vec
๋๋คํ๊ฒ target ๋ฒกํฐ๋ฅผ ๊ณ ๋ฅธ๋ค. (ํน์ ๋ฒ์์ ์๋์ฐ ์ฌ์ด์ฆ ๋ด๋ถ์์)
๊ณ์ฐ ๋น์ฉ -> slow ๋ฌธ์
๊ฐ์ํ๋ฅผ ์ํด ํธ๋ฆฌ ๊ตฌ์กฐ๋ฅผ ํ์ฉ (์ ๋น๋ -> ๋ deep)
Hierarchical softmax
ํด๋ฆฌ์คํฑํ ๋ค์ํ ๋ฐฉ๋ฒ๋ค์ด ์ ์ฉ๋ ์ ์๋ค.
Negative Sampling
์ธํ์ผ๋ก ๋ ๋จ์ด -> target์ ์์ธกํ๋ ๋ฌธ์ (0 or 1)
๋น๊ต์ ํฐ ๋ฐ์ดํฐ ์ -> K๋ฅผ ์๊ฒ ์ก๋๋ค.
์ฒซ๋ฒ์งธ ์ฃผ์ค๋ง 1 -> positive
์ดํ๋ก K๊ฐ๋ ๋ชจ๋ 0 -> negative
๋ฐ๋ผ์ negative sampling ์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ ๊ฒ
๊ธฐ์กด์ ๋ฌด๊ฑฐ์ด ์๊ทธ๋ง ์์๋ณด๋ค ํจ์ฌ ๊ณ์ฐ ๋ณต์ก๋๊ฐ ๊ฐ์ !
softmax => binary classification problem์ผ๋ก ๋ฐ๊พธ์ด ํด๊ฒฐ
์ด๋ป๊ฒ 0 ์ํ๋ค์ ๊ณ ๋ฅด๋? frequency์ ๋ฐ๋ผ ๊ณ์ฐ
GloVe Word Vectors
Sentiment Classification
labeling์ด ๋ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ๋ค๋ ๋ฌธ์ ์ ์ด ์๋ค.
common ๋์ค์ ๋ฐ์์ด ๊ถ๊ธํ ๋
RNN ๊ตฌ์กฐ ์ค many to one๊ณผ ์ฐ๊ด O
์ฌ๋ฌ ๋จ์ด (๋ฌธ์ฅ) input -> output (๊ฐ์ , timeseries ๊ฐ X)
Debiasing Word Embeddings
ML -> ์ค์ํ ํ๋จ์ ๋๊ตฌ๊ฐ ๋จ -> ์ด๋ฌํ ๋ฐ๋์งํ์ง ์์ bias๋ฅผ ์ ๊ฑฐํ๋ ๊ฒ์ ์ค์ํ๋ค
์ธ๊ฐ์ ๋จธ๋ฆฌ๋ณด๋ค, AI์ ํธ๊ฒฌ์ ์ ๊ฑฐํ๋ ๊ฒ์ด ๋ ์ฝ๋ค.
gender ๋ฒกํฐ ๋ฐฉํฅ์ ์ฐพ๊ณ , neutralize (์ถ์ ํฌ์)
์ดํ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๋๋ก equalize (ex, ๋ฒ ์ด๋น์ํฐ ํฌ์ธํธ๋ก๋ถํฐ ํ ๋จธ๋, ํ ์๋ฒ์ง ํฌ์ธํธ์ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๋๋ก ์กฐ์ )
PCA ๊ฐ๊ณ ์ ๊ธฐํ๋ค
'ArtificialIntelligence > 2023GoogleMLBootcamp' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[GoogleML] Transformer Network (Final) (0) | 2023.10.30 |
---|---|
[GoogleML] Sequence Models & Attention Mechanism (1) | 2023.10.30 |
[GoogleML] Natural Language Processing & Word Embeddings (1) | 2023.10.29 |
[GoogleML] Recurrent Neural Networks (1) | 2023.10.17 |
[GoogleML] Convolutional Neural Networks ์๋ฃ (0) | 2023.10.11 |