2022. 08.24 ๐Ÿ’ฌ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ: Natural Language Processing ๐Ÿ‘ฉ‍๐Ÿ’ป

2022. 8. 24. 16:34ใ†iOS/CoreMLCreateML

 

 

 

 

 

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ: Natural Language Processing (8/24)

 

 

1. ์ดํ•ด์™€ ์ง€๋Šฅ์ด ๋ฌด์—‡์ธ๊ฐ€? ์ธ๊ณต ์ง€๋Šฅ์— ๋Œ€ํ•œ ๊ทผ๋ณธ์ ์ธ ์งˆ๋ฌธ

- ๊ฒ€์ƒ‰ ์—”์ง„, ๋ฒˆ์—ญ๊ธฐ, AI ์Šคํ”ผ์ปค, ์†Œํ”ผ์•„(๋Œ€ํ™”๋ฅผ ์ด๋Œ์–ด ๋‚˜๊ฐ€๋Š” AI ์Šคํ”ผ์ปค, ๊ตญ๋‚ด ๋ฐฉ๋ฌธ)

- 4์ฐจ ์‚ฐ์—… ํ˜๋ช…, ์‚ฌ๋ฌผ ์ธํ„ฐ๋„ท (์ฃผ๋ณ€์˜ ๊ธฐ๊ธฐ๋“ค์„ ํ†ตํ•ด ๋ฌด์ˆ˜ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ƒ์„ฑ -> ์‚ฌ๋žŒ์ด ๊ฐ๋‹นํ•  ์ˆ˜ ์—†๋Š” ์–‘ -> ์ง€์‹์ด๋‚˜ ํŒจํ„ด์„ ์ธ๊ฐ„์ด ๋ถ„์„ํ•  ์ˆ˜ ์—†์Œ, ์ธ๊ฐ„๋งŒํผ ์ง€๋Šฅ์ ์ธ ๋ถ„์„์„ ํ•  ์ˆ˜ ์žˆ๋Š” AI)

; ๋น…๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ

 

2. ํฌ์Šค์ฝ”์™€ ๊ฐ™์€ ์ฒ ๊ฐ• ํšŒ์‚ฌ์—์„œ๋„ NLP๊ฐ€ ํ•„์š”ํ•œ๊ฐ€? 

- ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ: ๊ธฐ๊ณ„๊ฐ€ ์ธ๊ฐ„๋งŒํผ์˜ ์ง€๋Šฅ์„ ๊ฐ–๊ณ  ์žˆ๋‹ค๋Š” ์˜๋ฏธ

: ๊ฐ€์ •์ด๋“  ๊ณต์žฅ์ด๋“  ์ง€์น˜์ง€ ์•Š๊ณ , ์ธ๊ฐ„์ด ํ•˜๋Š” ์ผ์„ ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค.

 

- ๋ฌธ์ž๋กœ ํ‘œํ˜„๋  ์ˆ˜ ์—†๋Š” ๋งŽ์€ signal data(non-textual data) ์ƒ์„ฑ

-> ์ด๋Ÿฌํ•œ ๋งŽ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์–ด๋–ป๊ฒŒ ์ฒ˜๋ฆฌํ•˜๋Š”๊ฐ€์— ๋”ฐ๋ผ ํšŒ์‚ฌ์˜ ๊ฒฝ์Ÿ๋ ฅ์„ ์ขŒ์šฐํ•จ (๊ณต์žฅ์˜ ์ƒ์‚ฐ์„ฑ)

 

- Textual data: ์ˆ˜๋งŽ์€ ์žฅ์น˜๋“ค์„ ํ•จ๊ป˜ ์‚ฌ์šฉ -> ๋Š์ž„์—†์ด ๊ธฐ๊ณ„๋“ค์˜ ๊ณ ์žฅ์„ ์ˆ˜๋ฆฌํ•ด์•ผ ํ•œ๋‹ค.

: ๊ณผ๊ฑฐ์— ๋™์ผํ•œ ์ƒํ™ฉ์—์„œ ์–ด๋–ค ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ์ง€? (๊ธฐ์กด์—๋Š” ๋ช…์ธ, ์žฅ์ธ์˜ ๋จธ๋ฆฌ์†์— ์žˆ์—ˆ๋‹ค.) 

-> ์ค‘์•™ ์ง‘๊ถŒํ™” ๋œ database์—์„œ ๊ด€๋ฆฌํ•˜๋˜ ์ค‘์š”ํ•œ ๋ฐ์ดํ„ฐ, ์ˆจ๊ฒจ์ง„ ๋…ธํ•˜์šฐ๋“ค์„ ์–ด๋–ป๊ฒŒ ๊ด€๋ฆฌํ•˜๋Š”๊ฐ€?

-> ์ˆ˜๋งŽ์€ ์ง€์›์„œ๋ฅผ ์–ธ์ œ filteringํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€? (์ธ๊ณต์ง€๋Šฅ์˜ ๋„์›€์„ ๋ฐ›์„ ์ˆ˜ ์žˆ๋‹ค.)

- ์ง€์  ์žฌ์‚ฐ๊ถŒ๊ณผ ๊ด€๋ จ๋œ ํŠนํ—ˆ ๊ด€๋ จ ๋‚ด์šฉ๋„ text data 

 

- Text mining: ๊ตฌ์กฐํ™”๋˜์ง€ ์•Š์€ raw data์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ

(๊ณผํ•™ ๊ธฐ์ˆ  ๋…ผ๋ฌธ, ๋‰ด์Šค ๊ธฐ์‚ฌ, ์ด๋ฉ”์ผ, ๋ฌด์ˆ˜ํ•œ SNS ๊ธ€ ๋“ฑ๋“ฑ)

: ๋ฌธ์žฅ์ด๋‚˜ ๋ฌธ์„œ๊ฐ€ ๋‚˜ํƒ€๋‚ด๋Š” ์˜๋ฏธ๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋ฏ€๋กœ, ๊ฐ€์žฅ ๊ณ ๊ธ‰ ๊ธฐ์ˆ 

 

- information retrieval: ๋ฌธ์„œ ์š”์•ฝ, ๊ฒ€์ƒ‰ ๋“ฑ ์ „ํ†ต์ ์ธ ์—ฌ๋Ÿฌ ๋ฌธ์„œ, ์ •๋ณด ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•์— ํ•ด๋‹น

+ chat bot, text classification, ์ž๋™ ๋ฒˆ์—ญ ๋“ฑ๋“ฑ

 

3. ๊ธฐ๊ณ„๊ฐ€ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•œ๋‹ค๋ฉด, ์–ด๋–ค application์—์„œ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์„๊นŒ?

- ๊ต์ฐจ ์–ธ์–ด ๊ฒ€์ƒ‰ ์—”์ง„ (์ •๋ณด๋ฅผ ์ฐพ๊ณ  ์‹ถ์„ ๋•Œ, ํ•œ๊ตญ์–ด๋กœ ์งˆ์˜ -> ๊ด€๋ จ๋œ ๋ฌธ์„œ๋Š” ์–ธ์–ด์— ์ƒ๊ด€ํ•˜์ง€ ์•Š๊ณ  ๋ชจ๋‘ ์ฐพ์•„๋‚ด๋ฉด ์ข‹๊ฒ ๋‹ค.) cross-language information retrieval (์ผ๋ณธ์–ด๋กœ ๋œ ๋ฌธ์„œ์˜ ์ฒ ๊ฐ• ๊ด€๋ จ ํŠนํ—ˆ ๊ธฐ์ˆ ์„ ํ•œ๊ตญ์–ด๋กœ ๊ฒ€์ƒ‰ํ•  ์ˆ˜ ์žˆ๋‹ค.)

 

- ํŠนํ—ˆ ์ •๋ณด ์ถ”์ถœ (๊ตฌ์กฐํ™”๋œ ์ •๋ณด๊ฐ€ ์•„๋‹ˆ๋‹ค. Un-structed text: ์‚ฌ๋žŒ์ด ํ•ด๋‹น ์ •๋ณด๋ฅผ ๋ฐ”๋กœ ํŒŒ์•…ํ•˜๊ธฐ๊ฐ€ ์‰ฝ์ง€ ์•Š๋‹ค.) ์‹ ์ œํ’ˆ ์„ค๊ณ„ ๋ฐ ์ƒˆ๋กœ์šด ์•„์ด๋””์–ด์™€ ๊ด€๋ จ๋œ ํ•ด์™ธ ํŠนํ—ˆ ์ž๋ฃŒ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด ๊ฐœ๋ฐœ. (๋‚ด๊ฐ€ ์ถ”๋ก ํ•˜๊ณ ์ž ํ•˜๋Š” ๋‚ด์šฉ, ๋‚ด๊ฐ€ ๋””์ž์ธํ•œ ๋‚ด์šฉ์ด ํŠนํ—ˆ ์นจํ•ด์„ฑ์ด ์žˆ๋Š”์ง€ ํŠธ๋ž™ํ‚น)

: ์ œ์กฐ ๊ณต์ •๊ณผ parameter ๊ด€๋ จ๋œ ์ •๋ณด๋“ค -> ๊ฐ€๊นŒ์ด ๋ถ™์–ด์žˆ์ง€ ์•Š์•„ ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์›€

- ์ด์›ƒํ•˜์ง€ ์•Š๊ณ  ๋–จ์–ด์ ธ ์žˆ๋Š” ์ •๋ณด๋“ค, ๋ฌธ์žฅ์˜ ๊ตฌ์กฐ์— ๋Œ€ํ•ด ์ •ํ™•ํ•˜๊ฒŒ ์ดํ•ดํ•ด์•ผ ์ •๋ณด๋ฅผ ์ œ๋Œ€๋กœ ์ถ”์ถœํ•  ์ˆ˜ ์žˆ์Œ

 

- ์Œ์„ฑ ํšŒ์˜๋ก ์š”์•ฝ

์ˆ˜๋งŽ์€ ํšŒ์˜๋ก -> ํšŒ์˜ํ•  ๋•Œ ๋งˆ๋‹ค ๋…น์Œํ•œ ์Œ์„ฑ file ์†์—์„œ ์›ํ•˜๋Š” ์ •๋ณด๋ฅผ ์ฐพ์•„์•ผ ํ•จ

-> ์Œ์„ฑ ํšŒ์˜๋ก์„ ๊ธฐ๊ณ„๊ฐ€ ์ง์ ‘ ๋“ฃ๊ณ , ๋‚ด์šฉ์„ ์š”์•ฝํ•ด์ฃผ๋Š” ํ”„๋กœ๊ทธ๋žจ

- ์ผ๋ฐ˜ ํšŒ์‚ฌ์—์„œ ํ™œ์šฉํ•˜๊ธฐ ์ข‹์Œ

- ์Œ์„ฑ file์—์„œ ์ง์ ‘ ์š”์•ฝ or ์Œ์„ฑ ๋…น์Œ file์„ text ๋กœ ๋ฐ”๊พผ ๋’ค, text summarization ๊ณผ์ •

 

- ์ธ๊ฐ„์€ ์› ๋ฌธ์„œ๋ฅผ ์ฝ๊ณ , ์ƒˆ๋กœ์šด ์š”์•ฝ๋ณธ์„ ์ƒ์„ฑํ•จ -> ์ž์—ฐ์Šค๋Ÿฌ์›€

- ๊ธฐ๊ณ„๋Š” ์› ๋ฌธ์„œ๋งŒ์„ ํ†ตํ•ด, ์ค‘์š”ํ•œ ๋‹จ์–ด์™€ ๋ฌธ์žฅ์„ ๋‚จ๊ธฐ๋ฉฐ ์š”์•ฝ(๋ฌธ์žฅ ์ถ”์ถœ ๊ธฐ๋ฒ•) -> ์–ด์ƒ‰ํ•จ

- ์‹ ๋ฌธ ๊ธฐ์‚ฌ ์š”์•ฝ ๊ธฐ์ˆ  (์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋ฌธ์žฅ ์š”์•ฝ) -> ํ›จ์”ฌ ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ์„ธ๋ จ๋จ

 

- ํ•œ๊ตญ์–ด-ํ•œ๊ตญ ์ˆ˜ํ™” ๋ฒˆ์—ญ๊ธฐ

: TV ์•„๋ž˜์— ๋‚˜์˜ค๋Š” ํ•œ๊ตญ์–ด ์ž๋ง‰ -> ์„ ์ฒœ์ ์ธ ์ฒญ๊ฐ ์žฅ์• ์ธ์ด ์ดํ•ดํ•  ์ˆ˜ ์—†์Œ (์šฐ๋ฆฌ๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ์–ธ์–ด๋ฅผ ์ ‘ํ•œ ์ ์ด ์—†์Œ), ํ•œ๊ธ€์ด ๊ธ€์ž๋กœ ์ธ์‹์ด ์•ˆ๋จ

- ์ˆ˜ํ™”๋Š” ์šฐ๋ฆฌ๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” language์™€ ๋‹ค๋ฅด๋‹ค. (ํ‘œ์ •๊ณผ ์† ๋™์ž‘์„ ํ†ตํ•ด ์˜๋ฏธ๋ฅผ ์ „๋‹ฌ)

- ์ˆ˜์š”๊ฐ€ ๋งŽ์ง€ ์•Š์•„, ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ€์กฑํ•˜์—ฌ ์–ด๋ ค์›€์„ ๊ฒช์Œ

- ์ˆ˜ํ™”๋กœ ๊ตฌ์„ฑ๋œ ๋‹จ์–ด๋“ค์€ ์—ฌ๋Ÿฌ ๋‹จ์–ด๊ฐ€ ํ•˜๋‚˜์˜ ๋™์ž‘์œผ๋กœ ์••์ถ•๋œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค.

- ์‚ผ์„ฑ ์ „์ž: ์ˆ˜์ต ์‚ฌ์—…์€ ์•„๋‹ˆ์—ˆ๋‹ค. ์‚ฌํšŒ ๊ณตํ—Œ ์‚ฌ์—… -> ์ทจ์†Œ

 

4. NLP: ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ

- ๊ธฐ๊ณ„์—๊ฒŒ ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์–ด๋–ป๊ฒŒ ์ „๋‹ฌํ•˜๋Š”๊ฐ€?

- (๊ถ๊ทน์ ์ธ ๋ชฉํ‘œ) ๊ธฐ๊ณ„๊ฐ€ ์–ด๋–ป๊ฒŒ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ๋Šฅ๋ ฅ์„ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?

-> ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ๋Œ€ํ™”๋„ ๊ฐ€๋Šฅํ•˜์ง€ ์•Š์€๊ฐ€? (30๋…„ ์ „์˜ ์ปดํ“จํ„ฐ์™€ ์ง€๊ธˆ์˜ ์ปดํ“จํ„ฐ๋Š” ๋น„๊ต ๋ถˆ๊ฐ€๋Šฅํ•  ๋งŒํผ ๋ฐœ์ „ํ–ˆ๋Š”๋ฐ, ์•ž์œผ๋กœ 30๋…„ ๊ฐ„์˜ ๋ฐœ์ „์€ ๊ธฐ๊ณ„์™€ ์ธ๊ฐ„, ์™„๋ฒฝํ•œ ์†Œํ†ต ๊ฐ€๋Šฅํ•˜์ง€ ์•Š์„๊นŒ? -> ์ง€๊ธˆ์˜ ์„ฑ๊ณต์€ ์ œํ•œ๋œ ์˜์—ญ์˜ ์ œํ•œ๋œ ๋Šฅ๋ ฅ์ด๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋“  ์–ธ์–ด์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ๋Š” ์–ด๋ ต๋‹ค.)

 

- Text Processing: ๊ธ€๊ณผ ๊ด€๋ จ๋œ ์–ธ์–ด ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•

- Speech processing: ๋ง(์Œ์„ฑ)๊ณผ ๊ด€๋ จ๋œ ์–ธ์–ด ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•

- ํ•œ๊ธ€๊ณผ ํ•œ๊ตญ์–ด๋ฅผ ๊ตฌ๋ถ„ํ•˜์ž. (ํ•œ๊ตญ์–ด๊ฐ€ ๋ชจ๊ตญ์–ด, ํ•œ๊ธ€์€ ์ดํ›„์— ์ฐฝ์ œ๋œ ๊ฒƒ)

- ์–ธ์–ด๋ฅผ ๋ถ„์„ํ•˜์—ฌ ์ดํ•ด or ๋‚ด๊ฐ€ ์ดํ•ดํ•œ ๋‚ด์šฉ์„ ํ†ตํ•ด ์–ธ์–ด๋ฅผ ์ƒ์„ฑ

: ์ƒ์„ฑ์ด ์–ด๋ ต์ง€ ์•Š์•„์š”? (๋…ํ•ด ์œ„์ฃผ์˜ ๊ต์œก์„ ๋ฐ›๋‹ค ๋ณด๋‹ˆ, writing, speech๊ฐ€ ์–ด๋ ต๊ฒŒ ๋Š๋‚Œ)

- ์–ธ์–ด ์ฒ˜๋ฆฌ ๊ด€์ ์—์„œ ๋ณธ๋‹ค๋ฉด, ๋ถ„์„์ด ํ›จ์”ฌ ๋” ์–ด๋ ค์›€ (90%๋Š” ๋ถ„์„์„ ์œ„ํ•ด ๋ฐœ์ „)

 

- ์–ธ์–ด๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋‹จ๊ณ„ (์ธ๊ฐ„ ์Œ์„ฑ์˜ ๋ฐœํ™” 

-> ‘์Œ์„ฑ ์ธ์‹ ๊ธฐ์ˆ ์„ ํ†ตํ•ด ๊ธ€๋กœ ๋ณ€ํ™˜(์ „์ž ๊ณตํ•™์  ๊ด€์ ์—์„œ signal ๋ถ„์„๊ณผ ์—ฐ๊ด€) 

-> ๋ฌธ์ž๋กœ ํ‘œํ˜„๋œ text -> (์–ธ์–ดํ•™ or ์ปดํ“จํ„ฐ ๊ณตํ•™ ๊ด€์ )์—์„œ ๋‹จ์–ด ๊ตฌ์กฐ ๋ถ„์„ 

-> ์ปดํ“จํ„ฐ๊ฐ€ ์–ด๋–ค ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๊ฒƒ์ธ์ง€ ์ดํ•ด๋ฅผ ํ•ด์•ผ ๋ถ„๋ฅ˜, ๋ถ„์„์ด ๊ฐ€๋Šฅํ•จ 

 

-> ์šฐ๋ฆฌ๊ฐ€ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ๋ฌธ์žฅ์˜ ๊ฐœ์ˆ˜: ์ด๋ก ์ ์œผ๋กœ ๋ฌดํ•œ ๊ฐœ

-> ์ด๋ฅผ ์ž‘์€ ๋‹จ์œ„๋กœ ๋‚˜๋ˆ„์–ด ๋ถ„์„ (์›์†Œ์™€ ๊ฐ™์ด) -> ๋ฌธ์žฅ ๋‹จ์œ„๋ฅผ ๋‹จ์–ด ๋‹จ์œ„๋กœ ๋‚˜๋ˆ„์–ด ๋ถ„์„

- ์–ดํœ˜ ๋ถ„์„ (๋ฌธ์žฅ์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ๋‹จ์–ด์˜ ๊ฒฝ๊ณ„๊ฐ€ ๋ฌด์—‡์ธ๊ฐ€?)

- ๊ตฌ๋ฌธ ๋ถ„์„ (Syntax analysis): ๋ฌธ์žฅ์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์˜๋ฏธ๋ฅผ ๊ฐ€์งˆ ์ˆ˜ ์žˆ์Œ (์ค‘์˜์ ์ธ ํ‘œํ˜„๋„ ์žˆ๊ณ )

: ๋‹จ์–ด์˜ sequence๋Š” ๋™์ผํ•œ๋ฐ, ํ•ด๋‹น ๋ฌธ์žฅ์˜ ์˜๋ฏธ๋Š” ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋‹ค. ๋ฌธ๋งฅ๊ณผ ๋งฅ๋ฝ๋„ ์ค‘์š”

: bank๊ฐ€ ์€ํ–‰์ด๋ƒ ๊ฐ•๋‘‘์ด๋ƒ? ๋ง์›๊ฒฝ์„ ๊ฐ€์ง„ ๊ทธ๋…€๋ฅผ ๋ณด์•˜๋‹ค or ๋ง์›๊ฒฝ์œผ๋กœ ๊ทธ๋…€๋ฅผ ๋ณด์•˜๋‹ค

-> ๋”ฐ๋ผ์„œ sentence level์˜ ๋ฌธ์žฅ ๋ถ„์„๋„ ํ•„์š”ํ•˜๋‹ค.

 

5. Deep Neural Network, Black Box

- weight ๊ฐ€์ค‘์น˜๋ฅผ ์ค€ ํ•จ์ˆ˜ ์ฒ˜๋ฆฌ

- ์ˆ˜์‹ญ๋งŒ๊ฐœ ์ด์ƒ์˜ network -> ์‹ ๊ฒฝ๋ง ํ˜•์„ฑ 

-> ์ฃผ์–ด์ง„ input์— ๋Œ€ํ•ด ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” output์ด ๋‚˜์˜ค๋„๋ก ์‹ ๊ฒฝ๋ง์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋‹ค.

 

- back propagation ์•Œ๊ณ ๋ฆฌ์ฆ˜ (error ๊ฐ’์„ ๋ฐ”ํƒ•์œผ๋กœ weight ์กฐ์ •)

: weight training -> ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํ•™์Šต 

- ํŠน์„ฑ ํ•™์Šต(ํŠน์ง• ์ถ”์ถœ)๊นŒ์ง€ ์‹ ๊ฒฝ๋ง์ด ์•Œ์•„์„œ ํ•˜๋Š” ๊ฒƒ -> Deep Learning

: ์–ด๋–ค ํŠน์ง•์ด ์ค‘์š”ํ•  ์ง€, ๊ธฐ๊ณ„๊ฐ€ ์•Œ์•„์„œ ํŠน์ง•์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ

 

- black box Deep learning: ์™œ ์ด๋Ÿฐ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”์ง€? ํ•ด๋„ ์‚ฌ๋žŒ์ด ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋‚ด์šฉ์ด ์•„๋‹ˆ๋‹ค.

: ๊ฐ„ํŽธํ•˜๊ฒŒ ์“ธ ์ˆœ ์žˆ์ง€๋งŒ, ์ธ๊ณผ๊ด€๊ณ„ ํŒŒ์•… ๋“ฑ์ด ์–ด๋ ค์›€

- ์™œ ๊ทธ๋Ÿฐ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”๋Š”์ง€, ์šฐ๋ฆฌ๊ฐ€ ์–ด๋–ป๊ฒŒ ๊ฐœ์„ ํ•ด์•ผ ํ•˜๋Š”์ง€ ๋ถˆ๋ถ„๋ช…ํ•จ

(ํ•˜์ดํผ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๊ณ , ์ธต์„ ๋” ์Œ“๊ณ  ๋“ฑ์˜ ๊ฐœ์„ ์€ ๊ฐ€๋Šฅํ•˜๋‚˜, ์–˜๊ฐ€ ์™œ ์ด๋Ÿฐ ๊ฒฐ๊ณผ๋ฅผ ๋‚ธ ๊ฑด์ง€ ๊ทธ ์›์ธ์€ ์•Œ ์ˆ˜ ์—†์Œ. ์™œ ํ•ด๋‹น input์— ๋Œ€ํ•œ ์›จ์ดํŠธ๋ฅผ ์ด๋ ‡๊ฒŒ ์กฐ์ •ํ•˜๋Š” ๊ฑด์ง€, ์‚ฌ๋žŒ์ด ์ดํ•ดํ•  ์ˆ˜ ์—†์Œ)

 

- ์ธ๊ฐ„์ด ์›ํ•˜๋Š” ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ์ฃผ์ง€๋งŒ, ์™œ ์ด๋ ‡๊ฒŒ ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด์ฃผ์ง€? ์ด์— ๋Œ€ํ•œ ํŒ๋‹จ์ด ์–ด๋ ค์›€

- AI์˜ ์—ญ๊ณต: ๋‚ด๊ฐ€ ๊ฐœ๋ฐœํ•œ system์ธ๋ฐ, ๊ฐœ๋ฐœ์ž๊ฐ€ ๋ชจ๋ธ์˜ ํ•œ๊ณ„(์–˜๊ฐ€ ์–ด๋””๊นŒ์ง€ ๊ฐ€๋Šฅํ•œ์ง€ ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅ) ์•Œ ์ˆ˜ ์—†์Œ

 

- Representation learning: ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ input ์กฐ์ •

- ๋…ธ์ด์ฆˆ๊ฐ€ ๋งŽ์€ ์›๋ณธ ์ด๋ฏธ์ง€ ๋Œ€์‹ , CNN์„ ํ†ตํ•ด ํ‘œํ˜„ ํ•™์Šต ๋‹จ๊ณ„๋ฅผ ๊ฑฐ์นœ๋‹ค.

- ์›๋ณธ์„ ๋ณด์—ฌ์ฃผ๋Š” ๋Œ€์‹ , CNN์„ ํ†ต๊ณผํ•œ ํŠน์ง•์„ ๋’ท๋‹จ์˜ classifier์— ๋„˜๊ฒจ์ค€๋‹ค.

- image๋Š” ๊ดœ์ฐฎ์€๋ฐ text์˜ ๊ฒฝ์šฐ์—๋Š”, ์–ด๋–ป๊ฒŒ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„?

- ์ฃผ๋ณ€์˜ ๋‹จ์–ด๋ฅผ ํ†ตํ•ด stars๋ผ๋Š” ๋‹จ์–ด์˜ ์˜๋ฏธ๊ฐ€ ๊ฒฐ์ •๋œ๋‹ค. -> count ๊ฐœ๋…์„ ํ™œ์šฉํ•˜์—ฌ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„

-> ๋งค์šฐ dimension(์ฐจ์›)์ด ๋†’๋‹ค. 

- word embedding ์–ด๋–ป๊ฒŒ ์ œ๋Œ€๋กœ ํ‘œํ˜„ํ•ด์•ผ sentence๋ฅผ ์ œ๋Œ€๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์„๊นŒ? (RNN)

 

์ผ๋ฐ˜์ ์ธ ๊ฒฝ์šฐ, ๋”ฅ๋Ÿฌ๋‹๊ณผ ์ผ๋ฐ˜ ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ์˜ ์ฐจ์ด๋ฅผ ํžˆ๋“ ๋ ˆ์ด์–ด์˜ ์ˆ˜๋กœ ์„ค๋ช…ํ•˜๋Š” ์‚ฌ๋ก€๊ฐ€ ๋งŽ์€๋ฐ ํ‹€๋ฆฐ ๋ง์€ ์•„๋‹ˆ๋‚˜, ์ •ํ™•ํ•œ ์„ค๋ช…์€ ์•„๋‹ˆ๋‹ค.

ํžˆ๋“  ๋ ˆ์ด์–ด์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋จธ์‹ ๋Ÿฌ๋‹์œผ๋กœ ์ตœ์ ํ•ด๋ฅผ ์ฐพ๋Š” ๊ฒƒ์„ ๋„์™€์ฃผ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ •์ œ๋˜์ง€ ์•Š๋Š” ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์˜ ๋…ธ์ด์ฆˆ๋ฅผ ํ•ด์†Œํ•˜๊ณ  ๋น ๋ฅด๊ฒŒ ์˜ˆ์ธก๋œ ํ•ด๋ฅผ ์ฐพ๊ฒŒ ํ•ด ์ฃผ๋Š” ๊ฒƒ์ด๋‹ค

 

์˜ˆ์ปจ๋Œ€, ํžˆ๋“ ๋ ˆ์ด์–ด(Hidden Layer)๊ฐ€ ๋งŽ์œผ๋ฉด, ํ”ผ๋“œ๋ฐฑ ํšŒ์ˆ˜๊ฐ€ ์ ๋”๋ผ๋„ ์ˆ˜ํ•™์ ์œผ๋กœ ๋น ๋ฅธ ์ˆ˜๋ ด(์ตœ์ ์˜ ํ•ด)์„ ํ•  ์ˆ˜ ์žˆ๊ณ , ๋ฐ์ดํ„ฐ ๋…ธ์ด์ฆˆ์— ๋ณ„ ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š๊ณ  ์ตœ์  ์˜ˆ์ธก ๊ฐ’์„ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

-> ํžˆ๋“ ๋ ˆ์ด์–ด์˜ ์—ญํ• ์€ ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ๊ฐ„๋‹จํ•œ ๋ฌธ์ œ๋กœ ๋ฐ”๊พธ์–ด ๋น ๋ฅธ ์ˆ˜๋ ด์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ๊ฒƒ, ๋ฐ์ดํ„ฐ ๋…ธ์ด์ฆˆ ์˜ํ–ฅ์„ ์–ด๋Š์ •๋„ ํšŒํ”ผํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“œ๋Š” ๊ฒƒ

- ๊ณผ์ž‰ ์ˆ˜๋ ด(Overfitting)์„ ํ•˜๊ฒŒ ๋˜์–ด ๋‚˜์œ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜๋„ ์žˆ๋‹ค. 

์ธ๊ณต์ง€๋Šฅ ํ”„๋กœ๊ทธ๋žจ๋“ค์€ ๊ทธ๋Ÿฌํ•œ ๊ณผ์ž‰ ์ˆ˜๋ ด์„ ๋ง‰๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ ์„ธํŠธ(Set) ํ•ด์„(Test)๊ณผ ๊ฒ€์ฆ(Validation) ๋ฐ์ดํ„ฐ๋กœ ๋‚˜๋ˆ„๊ณ , ํ•ด์„ ๋ฐ์ดํ„ฐ๋กœ ์˜ˆ์ธก๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด ๊ฒ€์ฆ์šฉ ๋ฐ์ดํ„ฐ๋กœ ๋‹ค์‹œ ์˜ˆ์ธก๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์“ด๋‹ค.

(https://namu.wiki/w/๋”ฅ%20๋Ÿฌ๋‹)