2023. 3. 16. 22:36ใScience/2023GWNRWinter
AI for Science (NVIDIA)
- GPU ๊ฐ์
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ฌ์ฉ
- ํฌํธ๋, cpp, python์์๋ GPU ํ๋ก๊ทธ๋๋ฐ ๊ฐ๋ฅ
- Ex) CUPY(numpy), RAPIDS(pandas์ GPU ๋ฒ์ ), CUML(์ฌ์ดํท๋ฐ ๊ฐ์)
- CFD ์๋ฎฌ๋ ์ด์
, N-body ์๋ฎฌ๋ ์ด์
(GPU๊ฐ ์ ์ ์ฉ๋๋ ๋ถ์ผ), ์ฐ์ฃผ๋ก , ๋ถ์๋์ญํ ๊ณ์ฐ ์
- 3์ค loop -> x,y,z ๋ฐฉํฅ์ผ๋ก ์ค๋ ฅ ๊ณ์ฐ -> GPU ํฌํ
ํ ๋ ์ด๋ฌํ ๊ณ์ฐ์ ์ฝ๊ฒ ํ ์ ์๋ค.
- ํ ์ค ๋ฃ์ผ๋ฉด, GPU ๊ฐ์ํด์ ์๋ฐฑ๋ฐฐ ๋น ๋ฅด๊ฒ ๊ณ์ฐํ ์ ์๋ค.
- ์ฌ๊ธฐ๊ฐ AI ๋์
ํ๊ธฐ ์ , GPU ๊ฐ์์ ์ฌ์ฉํ๋ ๊ฒ
- AI : ๋ณธ๊ฒฉ์ ์ผ๋ก ์ธ๊ณต์ง๋ฅ ๋ถ์ผ
- Data driven
- Chat-GPT(openAI 3.5): AI ๋ถ์ผ๊ฐ ๊ฐ๊ด
- ์์๋ธ ๋ชจ๋ธ (Switch) -> parameter ์ ๋ง์ ๋ณด์ด๋ ๊ฒ
- ๋ชจ๋ธ ์ฌ์ด์ฆ๋ฅผ ๋๋ฆด์๋ก ํ ์ ์๋ ์ผ๋ค์ด ๋์ด๋๋ค. (์ธ์ด ๋ชจ๋ธ ๊ธฐ์ค)
- Chat-GPT ๊ฒฝ์ฐ - (๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์ฌ์ด์ฆ, ํ์ต ๋ฐ์ดํฐ, ์ปดํจํฐ ๋ฆฌ์์ค) ์
๋ค ์ ์ ํ ๋์ด๋์ผ ํจ
- ์์นด๋ฐ๋ฏธ์์ ์ฌ๋ฆฐ ๋ชจ๋ธ์ด ์ฌ๋ผ์ง๊ณ ์๋ค - ๋๋ถ๋ถ ๊ธฐ์
์์ ๊ฐ๋ฐ (๊ตฌ๊ธ, openAI ๋ฑ๋ฑ)
- Input(๋๋ฉ์ธ) - output(ํ๋ก์ฐ)
- AI์ ์ฅ์
- Data driven: input output ์๋ฎฌ๋ ์ด์
์ ๋์ด์ค ์ ์๋ค.
- ์ฅ์ - ์๋ฎฌ๋ ์ด์
์ ๋งค๋ฒ RUN
- AI: ํ์ต์ ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฌ์ง๋ง, ํ์ต์ด ๋๋ ๋ชจ๋ธ์ ๊ฐ์ง๊ณ ์๋น์คํ ๋์๋ ์๋ฎฌ๋ ์ด์
๋ณด๋ค ํจ์ฌ ํจ์จ์
- ๊ธฐํ ๋ฌธ์ ๋ฅผ AI๋ฅผ ํตํด ๋ถ์
- input๊ณผ output์ ์ด๋ป๊ฒ ๋ฃ์์ง ๊ณ ๋ฏผํด์ผ ํจ
- Supervised learning (์ง๋ํ์ต)
- Real variable์ ์ด๋ฏธ์ง์ฒ๋ผ ๋ฃ๋๋ค. (์ค์ ๋ ์ด๋ฏธ์ง๊ฐ ์๋๋ผ ๊ฐ๊ฐ ๋ณ์๋ค ๊ฐ์ ์๋ฏธ)
- ๋ฅ๋ฌ๋๋ ๋ดํด๋ฒ์ ์ฌ์ฉํ๋ค.
- Loss ๋ชฉ์ ํจ์์ ๋ฏธ๋ถ์ด ์์์ง๋ ๋ฐฉํฅ์ผ๋ก ํ์ต ๋ฐ๋ณต ์ํ
- ๋ฐฉ์ ์์ด ์ ๊ฒฝ๋ง์ผ๋ก ๋ฐ๋ ๊ฒ
- Adam optimizer
- ๊ธฐ์, ๊ธฐํ ๋ชจ๋ธ
- ๊ฐ์ธ์ด ์ทจ๋ฏธ์ํ๋ก ์ฐ๊ตฌํ ๋ชจ๋ธ (์ฐ๊ตฌ ๊ทธ๋ฃน๊ณผ ์ด๋ฆ์ด ์๋ค)
- ์ฑ๋ฅ์ด ์ ๋์ค๊ณ ,
- GPU๋ฅผ ํ ์ฅ๋ง ์จ์ ์ค๋ ๋๋ ธ๋ค (1์ฃผ์ผ ์ ๋)
- inference๋ 0.01์ด (์ํฐ ์น๋ฉด ๋ฐ๋ก ๋์ค๊ฒ)
- Accuracy๋ ์กฐ๊ธ ๋ฎ๋ค (ํด์๋๋ฅผ ๋ฎ์ถ์๋ค)
- ์์ฐ์ด ์ปธ๋ค๋ฉด ํด์๋๋ฅผ ๋ ๋์ผ ์ ์์์ ๊ฒ
- ๊ฐ์ธ๋ ์ด๋ฌํ ์ฐ๊ตฌ๋ฅผ ํ ์ ์๋ค๋ ๊ฐ๋ฅ์ฑ
- ๊ทธ ์ดํ๋ก ๊ตฌ๊ธ์ด ๋ฐ์ด๋ฆ
- ํ์จ์ด ์จ๋ ๋ชจ๋ธ
- ๊ฑฐ์ ์ด์ ์ ๋ชจ๋ธ๊ณผ ์ ์ฌ
- ์ด๋ฏธ์ง์ฒ๋ผ variable -> ์ธ์ฝ๋ฉ ๋์ฝ๋ฉ -> ํจ์น
- ์์ธก ๋ชจ๋ธ
- Transformer ๋ชจ๋ธ์ ๊ฐ์ ธ์์ ์ฌ์ฉํจ
- ์๊น์ ๋ฌ๋ฆฌ ํด์๋๊ฐ ๋๋ค (๋น๋์ค ์์ค ์ด๋ฏธ์ง)
- ์ฐ๊ตฌ ๊ฒฐ๊ณผ: ECMWF ๋ชจ๋ธ์ ํ๋ฆผ - AI๋ ์ ๋๋ก ์์ธกํจ
- ์ฒซ ๋ , AI๊ฐ ๋ ์ ๋ง์ท๋ค.
- Time interval์ ํค์ฐ๋๊น ๋ ์ ํํด์ก๋ค. (์๋ฌ๋์ ํจ๊ณผ)
- Step size๋ฅผ ํฌ๊ฒ ํ๋ ๊ฒ์ด ๋ ์ข๋ค (์๋ฎฌ๋ ์ด์
๊ณผ ๋ฐ๋)
- Alfhafold2
- ๋จ๋ฐฑ์ง ๊ฒฝ์ง ๋ํ CASP
- Alfhafold1 - ๊ตฌ๊ธ ๋ฅ๋ง์ธ๋
- ๊ตฌ๊ธ ๊ณ ๋ฉ์์ ์ฝ๋ฉํด๋ ์ ๊ณต
- MEGAMOLBART
- ์ ์ฌํ ํํ์์ ์๋ ค์ค (์ฑ๋ถ, ๋
์ฑ์ด ๋น์ทํ)
- ‘๋ฐํธ’๋ผ๋ ํ์ด์ค๋ถ์ด ์ ๊ณตํ๋ ๋ชจ๋ธ ํ์ฉ
- ๋ฐ์ดํฐ ์ธํ ์์ํ์ ์ด๋ป๊ฒ ๋ง์ถ์ง ๊ณ ๋ฏผ
- ๋ด๋ถ๋ ๊ฐ์ ธ๋ค ์ฌ์ฉํ๋ฉด ๋๋ค.
- ์ค๋ ฅํ
- ์บ๊ธ ๊ฒฝ์ง๋ํ ์ค๋ ฅํ ๋ฌธ์
- ์ง๋ ๋ฌ์ ์ด๋ ธ๋ค.
- ์ค๋ ฅํ detector ๋ง๋๋ ์ฒผ๋ฆฐ์ง์ ๋ฑ๋กํ์
- ์บ๊ธ์ science / NVIDIA์ ์ฐ๋ฝํ๋ฉด ๋์์ ์ค ์ ์๋ค.
- ์๋ฎฌ๋ ์ด์
ํ๋ ๊ฒ์ ํ์ด์ฌ์ผ๋ก ์ฝ๊ฒ ๋ง๋ค ์ ์๋ค.
- ๋
ธ์ด์ฆ๊ฐ ๋ง๋ค -> ๋
ธ์ด์ฆ ์ฒ๋ฆฌํ๋ ๊ฒ์ด ๊ต์ฅํ ํฐ ์ผ
- Feature engineering (ํน์ฑ ๊ณตํ - Q-transform ์ด๊ฒ ์ฌ๊ธฐ์ ํด๋น)
- ๋ฅ๋ฌ๋์ ๋ชจ๋ธ ๊ฐ์ ธ์ ์ฌ์ฉํ๋ฉด ๋๋ค
- TIMM์ผ๋ก ๋์ด์์ ์ฌ์ฉํ๋ฉด ๋จ
- ์๋ฎฌ๋ ์ด์
ํด์ chirp ์๊ทธ๋์ ๋ง๋ค๊ณ , freq ์ฃผ๊ธฐ ๋ง๋ค์ด์
- ๊ทธ๋ฅ ํ์ง ์๊ณ ๋
ธ์ด์ฆ๊ฐ ๊ต์ฅํ ํฌ๋ค -> ๋
ธ์ด์ฆ์์ ์๊ทธ๋์ ๋ฃ์์ ๋ ์ด๋ป๊ฒ ๋ณด์ด๋๊ฐ?
- SNR๋น์จ์ด ์ ์ข์ ๋ฐ์ดํฐ์ ์ํ๋ค.
- ์นด๋์
(์ฌ์ฅ ๋ชจ์์ ํธํฅ ๋ง์ดํฌ)
- Normalization (Log scale ์กฐ์ฌ)
- Noise ์ง์ด๋ฃ๊ธฐ, ์๋ ์กฐ์ ํ๊ธฐ(์ค๋ ฅํ๋ ๊ฐ๊ฒ ํ ์ ์๋ค. m1, m2 ์กฐ์ ๋ฑ๋ฑ)
- ์ต๋ํ ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค ์ ์๋ค.
- ๋ชจ๋ธ์ ๋์์๋ ๋ชจ๋ธ ๋ง์ด ์ฌ์ฉํ๋ค (CNN, LSTM, ํธ๋์คํฌ๋จธ)
- ๋ชฉ์ ํจ์ - ์๊ณ์ด - C2C loss, ๋ค์ํ ๋ก์ค๊ฐ ์๋ค.
- ๊ด์ธกํ ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌ
- ์คํ๋ ค ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๊ณ ๋ฏผํ ๊ฒ ์๋ค
- ๊ฐ์ด๋๊ฐ ์์ผ๋ฉด ์ข๋ค
- ๋๋ฒ์งธ ์บ๊ธ ๊ฒฝ์ง๋ํ
- ์ ์ฒ๋ฆฌํ input์ ์ค๋ค.
- label์ ์ค๋ค (์ค๋ ฅํ๋ค or ์๋๋ค)
- ์ค๋ ฅํ๋ฅผ ์๊ฒ ๋์ด์ suffle ์์ผ๋๋ค.
- ๋ฐ์ดํฐ๊ฐ chirp ์์น๋ฅผ ๋๋ค์ผ๋ก ๋ฐ๊พธ๊ณ ๋ฑ๋ฑ
- Data Driven Approach
- ๋ฐ์ดํฐ ๋ชจ๋๋ค
- ์์ง๋์ด๋ง์ ํธํด์ก๋ค -> ๊ฐ์ ธ์์ ์ฌ์ฉํ๋ฉด ๋จ
- ๊ณ ๋ฏผํ ๊ฒ์ ๋ฐ์ดํฐ, Task, ๋ชฉ์ ํจ์ ๋ญ ์ธ ๊ฑด์ง ๋ฑ๋ฑ
- MLP
- ๋ฉํฐ ๋ ์ด์ด ํผ์
ํธ๋ก
- CNN -> ํธ๋์คํฌ๋จธ -> ๋ค์ MLP๋ก ํ๊ท
- PINN (Physics informed neural network)
- Physics๋ ๋ด์ฌ๋ ๊ฒ์ผ๋ก ์์
- ๋ฌผ๋ฆฌ ์ ๋ณด๋ฅผ ์ง์ด๋ฃ์ด์ ๋๋ฆฌ์
- ์ง๊ธ์ ๊ต์ฅํ ํ์ด๋ธ๋ฆฌ๋ (๋ฐ์ดํฐ๋ง ์๋ ๊ฒ์ด ์๋๋ผ)
- information์ ์ํด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ฉด์ ํ์ต
- ์ ๊ฒฝ๋ง ํ์ด๊ฐ ๋ดํด๋ฒ ํ์ด์ ๋งค์ฐ ์ ์ฌ
- ํด๋น ๊ธฐ๋ฒ์ ์ฌ๊ธฐ์ ์ฑํํ๋ค.
- ์ปจ์
- ์ ๊ฒฝ๋ง์ ํ ๋, ๋ฌผ๋ฆฌ ๋ฐฉ์ ์์ ํ์ด๋ผ
- ๊ทธ๋ด๊บผ๋ฉด ์๋ฎฌ๋ ์ด์
ํ์ง? ์?
- AI ์ฅ์ : ํ์ต์ ์ค๋ ๊ฑธ๋ฆฌ์ง๋ง, ํ์ต์ด ๋๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง๊ณ ์ฆ์ ์ฌํํ ์ ์๋ค.
- Parameter, condition์ด ๋ฐ๋๋๋ผ๋, model parameter๋ง ์์ผ๋ฉด ok
- ๋ค๋ฅธ ๊ฐ์ ์์ธกํ๋ ๊ฒฝ์ฐ (2์ฐจ ํจ์์ ์ผํธ๋ง ๋ณด๊ณ ์ง์ ์ผ๋ก ์์ธก)
- ํด๊ฒฐ์ฑ
- ๋ชจ๋ data์ ๋ํ ํฌ์ธํธ๋ฅผ ์ฃผ๋ฉด ํด๊ฒฐ๋จ
- ๊ฐ์ด๋ ํธ๋ ์ด๋ (์ปจ์
)
- ๋ฐ์ดํฐ ๋๋ฆฌ๋ธ + ํผ์ง์ค -> ๋ฌธ์ ์์ด ํด๋ฅผ ์ฐพ์ ์ ์๋ค.
- 4๋จ๊ณ
- ์ ๊ฒฝ๋ง ๊ตฌ์ถ (๋ด๋ด๋ท ์์ฑ, ๋ฏธ๋ถ์ ํํ)
- Geometry (1D, 2D, 3D)
- Loss func (mse๋ฅผ ๋ง์ด ์ฌ์ฉํ๋ค)
- Test(๋ชจ๋๋ฌ์ค SDK๋ฅผ ๋ค์ด๋ฐ์ ์ฌ์ฉ)