2023. 10. 29. 16:52ใArtificialIntelligence/2023GoogleMLBootcamp
Word Representation
๋ด์ ์ ํตํด ์ ์ฌ๋๋ฅผ ํ์ ํ ์ ์๋ค.
๋ชจ๋ธ์ ์ ์ฅ์์ ์ฌ๊ณผ์ ์ค๋ ์ง feature vector๋ ์ ์ฌํ๋ค
ํน - ์ค๋ ์ง, ํธ - ์ค๋ ์ง ๋ณด๋ค ์ฌ๊ณผ - ์ค๋ ์ง๊ฐ ๋ ์ ์ฌํ ๊ด๊ณ
์๋ฒ ๋ฉ์ ๊ฐ๋
Using Word Embeddings
์ ์ด ํ์ต์ ํตํด ๋ ์์ ์์ training set์ ์ ์ฉ ๊ฐ๋ฅํ๋ค
์ด๋ฌํ ์ ์์ word embedding์ face encoding๊ณผ ์ ์ฌํ ์ ์ด ์๋ค! :)
Properties of Word Embeddings
man -> woman as king -> what?
์ด๋ป๊ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ผ๋ก ์ถ๋ก ํ ์ ์์๊น? (๋๋ฒกํฐ์ ์ฐจ๊ฐ ๋์ผํด์ง๋ feature -> gender)
300 ์ฐจ์์ ํํ ๊ณต๊ฐ์์ ์ฑ๋ณ์ ์๋ฏธํ๋ ๋ ๋ฒกํฐ๊ฐ ์ ์ฌํ๊ฒ ๋ํ๋๋ค.
๋ฐ๋ผ์ ํด๋น target word๋ฅผ ์ป์ผ๋ ค๋ฉด,
ew(๋์ ๋ฒกํฐ, ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋ต)๊ณผ, (eking - eman - ewoman) ์ ๊ฐ์ ์ ์ฌ๋๋ฅผ ์ต๋ํํ๋ w๋ฅผ ์ฐพ์ผ๋ฉด ๋๋ค.
T-SNE -> 300์ฐจ์์ 2D๋ก ๋งคํ์์ผ์, ๋ณด์ฌ์ค๋ค. (ํฐ์ฆ๋)
์ฝ์ฌ์ธ ์ ์ฌ๋๋ฅผ ์๋ฏธํ๋ sim
๋ ๋ฒกํฐ ์ฌ์ด์ ๊ฐ์ ์ฝ์ฌ์ธ ๊ฐ -> ์ ์ฌ๋๋ก ์ฌ์ฉ ๊ฐ๋ฅ
Embedding Matrix
์ ํซ ๋ฒกํฐ์ ์ ์ฒด embedding matrix์ ๋ด์ ์ ํตํด orange ์ด๋ง ๋ฝ์๋ผ ์ ์๋ค == e6257
'ArtificialIntelligence > 2023GoogleMLBootcamp' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[GoogleML] Sequence Models & Attention Mechanism (1) | 2023.10.30 |
---|---|
[GoogleML] Word Embeddings _ Word2vec & GloVe (0) | 2023.10.29 |
[GoogleML] Recurrent Neural Networks (1) | 2023.10.17 |
[GoogleML] Convolutional Neural Networks ์๋ฃ (0) | 2023.10.11 |
[GoogleML] Neural Style Transfer (2) | 2023.10.11 |