ArtificialIntelligence/DeepLearning(10)
-
Byte-Pair Encoding tokenization and Tiktoken
Byte-Pair Encoding tokenizationhttps://youtu.be/HEikzVL-lZU์ด๋ป๊ฒ ํ ํฐํ์ ๋จ์๊ฐ ๊ฒฐ์ ๋๋์ง ์ ์ ์๋ค. + Byte-Pair Encoding (BPE) was initially developed as an algorithm to compress texts, and then used by OpenAI for tokenization when pretraining the GPT model. It’s used by a lot of Transformer models, including GPT, GPT-2, RoBERTa, BART, and DeBERTa. 1) ์บ๋ฆญํฐ ๋ณ๋ก ๋ชจ๋ ๋ถ๋ฆฌํ๊ธฐ 2) Pair ๋จ์๋ก ๋น๋ ์ count 3) ๊ฐ์ฅ ๋ง์ ๋น๋๋ฅผ ๋ณด์ฌ์ฃผ๋ ..
2024.07.08 -
Transformer Tokenizer, Embedding and LLaMA
Tokenization and Embedding: Science Behind Large Language Model Every input that we are providing to GPT is nothing but a token (numerical id) or a sequence of tokens. GPT doesn’t understand the language the way humans do but it just processes sequence of numerical ids, that we call tokens. But how does it find the association among words(tokens) and provide human like response, here comes the c..
2024.07.06 -
KSC 2023 ํ๋ถ์ ๋ ผ๋ฌธ ๊ฒฝ์ง๋ํ ์ฐ์์
๐บ ์ด๋๋ ๊ฐ์๊ธฐ ๋ฐ์ ๋ฉ์ผ http://www.kiise.or.kr/academy/board/academyNewsView.fa?MENU_ID=080100&sch_add_bd=ํํ์์&NUM=2511 ํ๊ตญ์ ๋ณด๊ณผํํ www.kiise.or.kr ๐ซจ ๋ป๋ฐ์ ์ํด ์ ๋ฌผ ๊ฐ๋ค์ ๋ ์ด์ฌํ ์ด๊ฒ ์ต๋๋ค. ๋์ ๐ ๐ฎ ์์ฅ์ ๋ฑ๊ธฐ๋ก ๋ฐ์๋ค!
2024.02.13 -
[KSC 2023] KSC ํํ ํฌ์คํฐ ๋ฐํ at BEXCO
๐ 2023. 12. 22 ๊ธ์์ผ https://www.kiise.or.kr/conference/KSC/2023/ ํ๊ตญ์ ๋ณด๊ณผํํ - ํ์ ๋ํ ํํ์ด์ง www.kiise.or.kr ๐ ๋ถ์ฐ์์ ์ด๋ฆฐ ํํ์์ ํฌ์คํฐ ๋ฐํ๋ฅผ ํ๋ต๋๋ค. ๐ฅ ์์นจ๊น์ง ๋ง๊ฐ ๋ฌ๋ฆฌ๋ค๊ฐ ํ๋ค๋ฅ ๋ฒก์ค์ฝ๋ก ํฅํ์ต๋๋ค. ์์์์ ํก๋จ๋ณด๋ ํ๋ ๊ฑด๋๋ฉด ๋์ฐฉ ๐ฅ ๐คตโ๏ธ(9:00 ~ 10:30) ํ๊ฐํ์๋ ๊ต์๋ํํ ๋ฐํํ๊ณ , ํผ๋๋ฐฑ ๋ฐ์ ๋ค์, ๋ด ์๋ฆฌ์ ์ ์์ผ๋ฉด ์ข ์ข ๋ค๋ฅธ ๋ถ๋ค์ด ์ค๋ช ํด๋ฌ๋ผ๊ณ ์ค์ ๋ค! ๊ฐ๋์ ํฌ์คํฐ ์ฌ์ง๋ ์ฐ์ด๊ฐ์๋๋ฐ, "์์, ๋ต๋ต" ํ๊ณ ๊ฐ๋งํ ์์์์ง๋ง . ์ฌ์ค ์์ฒญ ๋ฟ๋ฏํ๋ต๋๋ค , , :) ๋จธ์ฑ ๐จ ๋ฐฉ๋ ๋ชป ์น์ฐ๊ณ ๋์์, ๋ฐ๋ก ์์๋ก ๋์๊ฐ์ ์ฒดํฌ์์ ๋ง์น๊ณ ๋ฐฅ ๋จน์ผ๋ฌ ์๋ฉด์ผ๋ก ๋์์ โ๏ธ ๋ถ๋ช . ํ๊ฒจ์ธ์๋ ๋ฐ..
2023.12.22 -
[GoogleML] Practical Advice for Using ConvNets
Using Open-Source Implementation git-hub์ ํตํด repo ๋ค์ด๋ก๋ ๋ฐ๊ธฐ ์คํ์์ค๋ก ๊ตฌํ๋ ๋คํธ์ํฌ ๋ค์ด๋ฐ๊ธฐ Transfer Learning ๋๊ฒฐ๋ฐฉ์ training set ๋ฐ์ดํฐ ์๊ฐ ๋ถ์กฑํ ๋, ์ด๋ฏธ ํ์ต๋ ๋คํธ์ํฌ์์ ๋ท๋จ softmax ๋ถ๋ถ์ ์ ๊ฑฐ new ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ถ์ฌ์ ํ์ต์ํจ๋ค. ์์ ๋คํธ์ํฌ๋ freeze (์ ํ์ต๋ weight๋ฅผ ๊ทธ๋๋ก ์ฌ์ฉ) training์ด ์กฐ๊ธ ๋ ๋ง๋ค๋ฉด ๋ ๋ง์ layer๋ฅผ ํ์ตํ ์ ์๋ค freeze layer๋ฅผ ์ค์ผ ์ ์๋ค open source ์ด๋ฏธ ํ์ต๋ weight๋ฅผ ๋ค์ด๋ก๋ ๋ฐ๊ณ , ์ํ๋ ๋ถ๋ถ๋ง ์ ํ์ ์ผ๋ก ํ์ต์ํฌ ์ ์๋ ์ ์ด ํ์ต large computational cost๋ฅผ ์ค์ผ ์ ์๋ค Data Augmentation..
2023.10.07 -
[Slurm] Dataset Condensation model ๋๋ฆฌ๊ธฐ (feat. ๊ณต์ฉGPU)
https://github.com/VICO-UoE/DatasetCondensation GitHub - VICO-UoE/DatasetCondensation: Dataset Condensation (ICLR21 and ICML21) Dataset Condensation (ICLR21 and ICML21). Contribute to VICO-UoE/DatasetCondensation development by creating an account on GitHub. github.com ๋๋ ค๋ณผ ๋ชจ๋ธ์ ์ด ์์ด์์ต๋๋ค. . . ๊น๋จน๊ธฐ ์ ์ ๋ช ๋ น์ด ์ ๋ฆฌ โ๏ธ conda init conda list conda env list conda activate pythorch1.12.1_p38 source ~/.bashrc v..
2023.09.28 -
[OpenAI] ChatGPT Prompt ๊ฐ๋ฐ
https://platform.openai.com/examples OpenAI Platform Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform. platform.openai.com ๐ฉ๐ป UI๋ ๊น๋ํ๊ณ ์งฑ ์ด์๋ค. structure๋ ํ๋ฉด์ ์ง์ธ ๊ตฌ์กฐ๊ฐ API JSON request์ ๊ทธ๋๋ก ๋ฐ์๋์ด์, ๊ฐ๋ฐํ๊ธฐ ๋๋ฌด ์ข์๋ค. :) ๐ฅบ ํด๋น ํ๋ฉด์์ ํธ์ถํ๋ API ์ฝ๋๋ ๊ทธ๋๋ก ๋ณด์ฌ์ค๋ค. ์ต๊ณ ๋ค. ๐ message ๊ตฌ์กฐ๋ง ์กฐ๊ธ ์์ ํด์ colab์์ ๊ฐ๋ฐํ๋ค. ๐ฉ๐ป ๋ค๋ฅธ ์ฌ๋ฏธ์๋ ๊ธฐ๋ฅ๋ค๋ ๋ง์ ๊ฒ ๊ฐ๋ค. ํ๋ก์ ํธ์ ํ์ฉํ๋ฉด ์ ๋ง ํธํ๊ณ , ๋น ๋ฅด๊ฒ ๊ตฌํ..
2023.09.18 -
GAN Colorization Code
์ฐธ๊ณ ํ ์ฝ๋: https://github.com/mrzhu-cool/pix2pix-pytorch GitHub - mrzhu-cool/pix2pix-pytorch: PyTorch implementation of "Image-to-Image Translation Using Conditional Adversarial Network PyTorch implementation of "Image-to-Image Translation Using Conditional Adversarial Networks". - GitHub - mrzhu-cool/pix2pix-pytorch: PyTorch implementation of "Image-to-Image Transl... github.com network.py import ..
2022.08.28 -
๐ CycleGan ์ด๋ฏธ์ง ์์ฑ ๋ชจ๋ธ
๐ฉ๐ป Git-hub Link: https://github.com/SohyeonKim-dev/CycleGAN GitHub - SohyeonKim-dev/CycleGAN: 2022 HYPER cycle-GAN ๊ณต๋ชจ์ 2022 HYPER cycle-GAN ๊ณต๋ชจ์ . Contribute to SohyeonKim-dev/CycleGAN development by creating an account on GitHub. github.com ๐ฉ๐ป ๋๋ ์ 1) ์๊ฐ๋ณด๋ค ์ฝ๋ ํด์์ ์ด๋ ต์ง ์์๋ค. 2) ์์ ์ด์์ผ๋ก ํ๋ จํ๋๋ฐ ์๊ฐ ๋ง์ด ๊ฑธ๋ฆผ ๐คข 3) ๊ณต๋ชจ์ ์ค๋น๋ก ์ฑ ๋ ์ฐพ์ ์ฝ์๋๋ฐ, ์ฒ์์ผ๋ก ํ๋ ํด๋ดค๋ค. (๋ฏธ์ ๊ด์ GAN ๋ฅ๋ฌ๋ ์ค์ ํ๋ก์ ํธ, ๋ฐ์ด๋น๋ ํฌ์คํฐ) ํ์ํ ๋ถ๋ถ๋ง ์ฐพ์์ ์ฝ๊ณ , ๋๋จธ์ง ๋ถ๋ถ์ ๋น ๋ฅด๊ฒ ..
2022.07.02 -
๐จ GAN(Generative Adversarial network) ์ด๋? ๐ฉ๐ป
์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง(Generative Adversarial network) https://arxiv.org/abs/1406.2661 https://thispersondoesnotexist.com https://www.youtube.com/watch?v=AVvlDmhHgC4 https://www.youtube.com/watch?v=z-LIpUX-lpc Image to image GAN 1) Pix to Pix 2) Cycle GAN 3) Conditional GAN 4) Stacked GAN 5) Information maximizing GAN 6) Super resolution GAN 7) Patch GAN 8) Pix2pixhd ๋ ผ๋ฌธ ์๋ฃ : ์ค์์ด์ GAN ๊ฐ์
2022.06.24