Continuous Learning_Startup & Investment
Open in Telegram
We journey together through the captivating realms of entrepreneurship, investment, life, and technology. This is my chronicle of exploration, where I capture and share the lessons that shape our world. Join us and let's never stop learning!
Show more2 299
Subscribers
-224 hours
-147 days
-4130 days
Posts Archive
Frontier models keep getting more and more expensive to train, while commodity models drop in price each year as performance goes up (for example, it is probably ~5X cheaper to train GPT-3.5 equivalent now than 2 years ago)
AI code asisstant -> AI Coder
Chatbot -> Assistant -> Agent.
์ฒ์์ ํน์ ์ง๊ตฐ์ ์์ฐ์ฑ์ ๋์ด๋ ์์ค์ด์ง๋ง ์ฅ๊ธฐ์ ์ผ๋ก ๊ทธ ์ง๊ตฐ์ ์ํฌ ํ๋ก์ฐ๋ฅผ ๋์ฒดํด๊ฐ๋ฉด์ ์ฌ๋ฌ Agent๋ฅผ ๋ค๋ฃจ๋ 1๋ช
์ ์์ฐ์ฑ์ด ๊ธ๊ฒฉํ ์ค๋ฅด๋ ๊ฒ ์ผ๋ฐํ๋์ง ์์์ง.
We live in such strange times. Apple, a company famous for its secrecy, published a paper with staggering amount of details on their multimodal foundation model. Those who are supposed to be open are now wayyy less than Apple.
MM1 is a treasure trove of analysis. They discuss lots of architecture designs and even disclose that they train on GPT-4V-generated data. They provide exact scaling law coefficients (to 4 significant figures), MoE settings, and even optimal learning rate functions.
I have not seen this level of details from a big tech's whitepaper for a very, very long time. I'm also shocked they didn't put any effort on PR. MM1 just gets dropped, like a Mistral magnet link, on Arxiv out of nowhere.
Apple's so back! Paper: https://lnkd.in/g5hDiU2k
https://youtu.be/mqJ5YKlMIaM?si=ExGciQShPnWMF7oh
์์ฆ์ ์ด์:
์ฝ 40์ผ ์ ๋์ ๊ธฐ๊ฐ์ ์์ฆ์ผ๋ก ์ค์ ํ๊ณ , ์์ฆ๋ง๋ค ๋ช
ํํ ๋ชฉํ๋ฅผ ์ธ์ ๋ฌ์ฑํ๊ณ ์ ํจ.
์์ฆ์ด ๋๋๋ฉด ํ๊ณ ๋ฅผ ํตํด ์ฑ๊ณต ์์ธ์ ๋ถ์ํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก ํต์ฌ ๊ฐ์น๋ฅผ ์ ๋ฆฝํด ๋๊ฐ.
์์ฆ ์ฌ์ด์๋ ํผํธ์คํ(Pit-stop) ๊ธฐ๊ฐ์ ๋์ด ๋ฌธ์ ์ ๊ณผ ๊ธฐํ ์์ธ์ ํ์
ํ๊ณ ์ฐ์ ์์๋ฅผ ์ค์ .
๊ตฌ์ฑ์ ์ฃผ๋์ ๋ฌธ์ ํด๊ฒฐ:
๊ตฌ์ฑ์๋ค์ด ํจ๊ป ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ ํด๊ฒฐ ๋ฐฉ์์ ๋ชจ์ํ๋ ๊ฒ์ ์ค์ํจ.
์ค์ฟผ๋ ๋จ์๋ก ๊ตฌ์ฑ์๋ค์ด ์๋ฐ์ ์ผ๋ก ๋ชจ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํจ.
๋ํ๊ฐ ์ผ๋ฐฉ์ ์ผ๋ก ๋ฌธ์ ์ ํด๋ต์ ์ ์ํ๊ธฐ๋ณด๋ค๋, ๊ตฌ์ฑ์๋ค์ ์๊ฒฌ์ ์กด์คํ๊ณ ํฉ์๋ฅผ ์ด๋์ด ๋ด๊ณ ์ ํจ.
ํต์ฌ ๊ฐ์น ๊ธฐ๋ฐ์ ์์ฌ๊ฒฐ์ :
ํ์ฌ์ ํต์ฌ ๊ฐ์น๋ฅผ ์์ฌ๊ฒฐ์ ์ ๊ธฐ์ค์ผ๋ก ์ผ์.
๋ํ์ ๊ฒฐ์ ์ด๋ผ๋ ํต์ฌ ๊ฐ์น์ ๋ถํฉํ์ง ์์ผ๋ฉด ๊ตฌ์ฑ์๋ค์ด ์์ ๋กญ๊ฒ ์๊ฒฌ์ ๊ฐ์งํ ์ ์์.
์ด๋ฅผ ํตํด ์กฐ์ง์ ์ ์ฐ์ฑ๊ณผ ์ ์๋ ฅ์ ๋์ด๊ณ ์ ํจ.
์ ๋ณด์ ํฌ๋ช
ํ ๊ณต์ :
๊ฐ์ธ์ ์ฐ๋ด๊ณผ ๋ณด์์ ์ ์ธํ ๋ชจ๋ ์ ๋ณด๋ฅผ ๊ตฌ์ฑ์๋ค๊ณผ ๊ณต์ ํจ.
๊ฒฝ์์ง์ ๋ฒ์ธ ์นด๋ ์ฌ์ฉ ๋ด์ญ๊ณผ ํ์ฌ์ ์ฌ๋ฌด ์ํฉ ๋ฑ์ ๊ณต๊ฐํ์ฌ ๊ตฌ์ฑ์๋ค์ด ์ ๋ณด์ ๊ธฐ๋ฐํ ์์ฌ๊ฒฐ์ ์ ํ ์ ์๋๋ก ํจ.
์์จ๊ณผ ์ฑ
์์ ์กฐํ:
๊ตฌ์ฑ์๋ค์๊ฒ ๋ฌธ์ ํด๊ฒฐ์ ์์จ์ฑ์ ๋ถ์ฌํ๋, ๊ทธ์ ๋ฐ๋ฅธ ์ฑ
์๋ ํจ๊ป ์ง.
์ค์ค๋ก ๋ฌธ์ ๋ฅผ ์ฐพ๊ณ ํด๊ฒฐํ๊ณ ์ ํ๋ ๊ตฌ์ฑ์๋ค์ ์ด์ ๊ณผ ๋ชฐ์
์ ์ด๋์ด ๋ด๊ณ ์ ํจ.
๋ฒ์ง์์๋ AI ๊ฐ ๋ฏธํ
์ ๋ฐ์์ฐ๊ณ ์์ฝ์ ํ๊ณ ์์ต๋๋ค. ๊ณ์ฐํด ๋ดค๋๋ ํ๊ฑด๋น 300์ ์ ๋๋๋ผ๊ณ ์. ์ข์ ์์ฝ์ ๋ง๋ค๊ธฐ๊น์ง์ ๊ณผ์ ๊ณผ ์ํ์ฐฉ์ค๋ฅผ ๊ณต์ ํ๋ ค ํฉ๋๋ค.
โSTT(๋ฐ์์ฐ๊ธฐ) ํ๋ฆฌํฐ๊ฐ ๋๋ฌด ์ข์ง ์์์. ๊ฐ์ ํ ์ ์์๊น์?"
์ ๊ฐ ๋ฒ์ง์ ํจ๊ป ํ๊ณ ์ฒ์ ๋ฐ์ ์์ฒญ์
๋๋ค. ์ด๋ ๊น์ง๋ ์ฌ๋์ด ๋ฏธํ
์ ์์ฝํ๊ณ ๊ณต์ ํ๊ณ ์์๋๋ฐ ๋ฐ์์ฐ๊ธฐ ํ๋ฆฌํฐ๊ฐ ์ข์ง ์์ผ๋ ๋ฏธํ
์์์ ๋ค์ ๋๋ ค๊ฐ๋ฉด์ ๋ด์ผํ๋ ์์ฒญ๋ ๋ฆฌ์์ค๊ฐ ์๋น๋๊ณ ์์์ฃ . ๊ทธ๋์ ๋ฐ์์ฐ๊ธฐ๊ฐ ์ ๋๋ฉด ์์์ ๋ณด์ง ์๊ณ ํ
์คํธ๋ง ์ฝ์ด์ ์์ฝํ๋ฉด ๋๋ ํจ์ฌ ์๊ฐ์ด ์ค์ด๋ค ๊ฒ์ด๋ผ๋ ์๊ฐ์ด์์ฃ .
์ ์์์ ๋ด์ผํ๊ณ ๋ฐ์์ฐ๊ธฐ๋ฅผ ํด์ผ ํ๋๊ณ ์?
๋ฒ์ง๋ ์ธ์ฌ๊ฐ ํ์ํ ๊ณ ๊ฐ์ฌ์๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ์ธ์ฌ๋ฅผ ๋งค์นญํ๋ ํ๋ซํผ์
๋๋ค. ๊ทธ๋ ๊ธฐ์ ์ธ์ฌ๋ฅผ ์์ฒญํ ๊ณ ๊ฐ์ฌ์ ๊ผญ 30๋ถ ์ด์์ ๋ฏธํ
์ ํ๊ณ ๋ฌธ์ ๋ฅผ ์ ์ํ๋๋ฐ์. ์ด ๊ณผ์ ์์ ๊ณ ๊ฐ์ฌ์์ ๋งํ ๋ฌธ์ ์ ์ค์ ๋ฌธ์ ๊ฐ ๋ค๋ฅธ ๊ฒฝ์ฐ๊ฐ ๋ง์ฃ . ๊ทธ๋ ๊ธฐ์ ๊ณ ๊ฐ์ฌ์ ๊น์ด์๋ ๋ํ๋ฅผ ์ฃผ๊ณ ๋ฐ์ผ๋ฉฐ ๋ฌธ์ ๋ฅผ ๋ค์ ์ ์ํด์ผ ํ๊ณ ์ด ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ธ์ฌ ๋งค์นญ์ ์ค๋นํ๊ฒ ๋ฉ๋๋ค. ๊ทธ๋์ ๋น์ฐํ๊ฒ๋ ์ด ๋ฏธํ
๋ฐ์ดํฐ๊ฐ ์ ํฌ์๊ฒ๋ ๋๋ฌด๋๋ฌด ์ค์ํ ์ ๋ณด์ธ๊ฑฐ์ฃ .
< ๋ฌธ์ ํด๊ฒฐํ๋ฌ ๊ฐ๊ธฐ >
Step 1. ๋ฐ์์ฐ๊ธฐ ์ํ๊ฒ ๋ง๋ค๊ธฐ
์ฒ์ ๋ฐ์์ฐ๊ธฐ ๋ฌธ์ ๋ฅผ ๋ฐ์์๋๋ ๋ค์ํ STT ๋ชจ๋ธ์ ์ฐพ์๋ณด๊ธฐ ์์ํ์ด์. ์ ๊ฐ Data Scientist ๋ก๋ ์ค๋ซ๋์ ์ผํ๊ธฐ์ ์ข์ STT ๋ชจ๋ธ์ ์ฐพ์์ ์ ์ฉํ๋ฉด ์ถฉ๋ถํ ๊ฐ์ ํ ์ ์์ ๊ฒ ๊ฐ์๊ฑฐ๋ ์. ๊ทธ๋์ ํ๊น
ํ์ด์ค, ๊ตฌ๊ธ๋ฑ ์ฌ๋ฌ ๊ณณ์ ๋์๋ค๋๋ฉด์ ๋ชจ๋ธ์ ์ฐพ์๋ดค๊ณ OpenAI ์ Whisper ๋ชจ๋ธ์ด ๊ฐ์ฅ ๋ฐ์ด๋๋ค๊ณ ํ๋จํ ์ ์๊ฒ ๋์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ Whisper ๋ชจ๋ธ์ ๊ณต๊ฐ๋์ด ์์ด์ ๋ฌด๋ฃ๊ธฐ๋ ํ๊ณ ์. ํนํ Whisper ๋ ์ธ๊ฐ์ง ๋ชจ๋ธ์ด ์๋๋ฐ ๊ฐ์ฅ ํฐ large-v2 ๋ชจ๋ธ์ ์ฐ๋ฉด ํ๊ตญ์ด๋ ์์ฃผ ์ ๋ฐ์์ธ ์ ์๋ค๊ณ ํ๋๋ผ๊ณ ์. ๊ทธ๋์ ์ด๋์ ๋ ํ
์คํธ๋ฅผ ํด ๋ณด์๊ณ ์ด ๋ชจ๋ธ์ ์ฐ๊ธฐ๋ก ๊ฒฐ์ ํ์ต๋๋ค. Medium, small ๋ชจ๋ธ์ ์์ค์ ๊ธฐ๋์ ๋ฏธ์น์ง ๋ชปํ๋๋ผ๊ณ ์.
Step 2. ๋ชจ๋ธ ๊ตฌ์ถํ๊ธฐ
์ด์ ๋ชจ๋ธ์ด ์ ํด์ก์ผ๋ ์๋ฒ๋ฅผ ๊ตฌ์ถํด์ ๋ชจ๋ธ์ ์๋น์ค ํ ์ค๋น๋ฅผ ํ๋ฉด ๋ฉ๋๋ค. API ์๋ฒ๋ฅผ ๋ง๋ค๊ณ ๋ชจ๋ธ๊ณผ ์ฐ๋ํด์ ๋ฏธํ
์์ํ์ผ์ ๋ฐ์์ ์ฒ๋ฆฌํ์ Whisper ๋ชจ๋ธ์ด ๋ฐ์์ฐ๊ธฐ ํ ํ
์คํธ๋ฅผ ์๋ตํด์ฃผ๋ฉด ๋ฉ๋๋ค. ์ฅ๋น๋ฅผ ์ฐ์ ํด ๋ด๊ณ ๊ฝค ๋น์ผ ์ฅ๋น๋ฅผ ์ค๋นํด์ผ ํ๋๋ผ๊ณ ์. ๋น์ฉ์ด ๊ฝค ํฌ๊ฒ ํ์ํ ๊ฒ ๊ฐ์์ต๋๋ค. ์ด๋๋ถํฐ ๊ณ ๋ฏผ์ด ์์๋์์ต๋๋ค.
์ง๊ธ์ ํ๋ฃจ์ 10~20๊ฐ์ ๋ฏธํ
์ ์ฒ๋ฆฌํ ํ
๋ฐโฆ ์ด๋ ๊ฒ ๊ตฌ์ถํ๊ณ ๋น์ฉ์ ์ฐ๋ ๊ฒ ๋ง๋?
๋ด๊ฐ ์ง๊ธ ํด๊ฒฐํ๋ ค๋ ๋ฌธ์ ์ ๊ฐ์ฅ ์ ์ ํ ๋ฐฉ๋ฒ์ ์ฐพ์ ๊ฒ์ด ๋ง๋?
์ ๊ฐ ํด์๋ ์ผ๋ค์ ์์ฌํ๊ธฐ ์์ํ์ต๋๋ค.
Reset. ๋ค์ ์ฒ์๋ถํฐ ์์ํ๊ธฐ
โSTT(๋ฐ์์ฐ๊ธฐ) ํ๋ฆฌํฐ๊ฐ ๋๋ฌด ์ข์ง ์์์. ๊ฐ์ ํ ์ ์์๊น์?
์ ๊ฐ ๋ฐ์ ์์ฒญ์ ๋ถ๋ช
์ด๊ฒ์ด์์ต๋๋ค. ์ด ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ์ด๋ผ๋ฉด ์ ๋ ์ ์ ํ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๊ณ ์์์ต๋๋ค.
ํ์ง๋ง, ์ ๋ ๋ฌธ์ ๋ฅผ ๋ ๊น์ด ์ดํด๋ณด์ง ๋ชปํ์ต๋๋ค.
ํ์ด ํ์ํ ๊ฒ์ ๋จ์ํ โSTT ๊ณ ๋ํโ ๊ฐ ์๋์์ต๋๋ค.
ํ์ด ํ์ํ ๊ฒ์ ๋ชจ๋ ๋ฏธํ
์ โ์ ๊ทผ ํ๊ธฐ ์ฌ์ด ํํ๋ก ๋ณํ(STT)โ ํ๊ณ โ์ ์ ๋ฆฌ(์์ฝ)โ ํ๋ ๊ฒ์ด์์ต๋๋ค.
๊ทธ๋์ผ ๊ทธ ์ ๋ณด๋ฅผ ๋ฒ์งํ์ ๋ณธ์
์ธ "๊ณ ๊ฐ์ฌ์ ์๊ตฌ์ฌํญ์ ์ดํดํ๊ณ ์ ์ ํ ์ธ์ฌ๋ฅผ ๋งค์นญํ๋ ์ผ"์ ํ์ฉํ ์ ์๊ธฐ ๋๋ฌธ์
๋๋ค.
์ด ๋๋ถํฐ ์ ๋ STT๋ชจ๋ธ์ด ์๋๋ผ ๋ฒ์ง๊ฐ ๊ณ ๊ฐ์ฌ๋ฅผ ๋ง๋๊ณ ์ธ์ฌ๋ฅผ ์ถ์ฒํ๋ ๋ชจ๋ ์๊ฐ์ AI๋ฅผ ์ด์ฉํด์ ๋ ํจ์จํ ํ ์ ์์๊น ๊ณ ๋ฏผํ๊ธฐ ์์ํ์ต๋๋ค.
๊ทธ๋์ ์ข์ ๋ฐ์์ฐ๊ธฐ์ ์์ฝ์ ๋ง๋ค๊ธฐ ์ํด ์๋ ๊ณผ์ ๋ค์ ์งํํ๊ฒ ๋ฉ๋๋ค.
1. ChatGPT API (STT, Chat Completion) ๋ฅผ ์ ๊ทน ์ฌ์ฉํ๋ค
2. API ๋ฅผ ์ ์ฐ๊ธฐ ์ํด์ ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ๋ฅผ ๊ฑฐ๊ธฐ์ ๋ง์ถ๋ค
3. ์์ฝ ์๋ํ ํ๊ธฐ ์ํด ๋ฏธํ
์๋ฃจ์
์ ์ฝ๋ผ๋ณด์์ ์ค์ผ๋ก ๋ฐ๊พผ๋ค
4. ํ์๋ค์ ํผ๋๋ฐฑ์ ๋ค์ผ๋ฉด์ ChatGPT ํ๋กฌํํธ๋ฅผ ๋ฐ๊พธ๊ณ ์ฌ๋ฌ ๋ฒ์ ์ ํ
์คํธ ํ๋ค.
5. ์ฌ๋์ ์ด์ฉํด์ ์ฝ๊ฒ ์ ๊ทผํ ์ ์๋๋ก ๋ง๋ ๋ค.
6. ์์ธ ๋ฐ์ดํฐ๋ก ๋ ํฐ ๊ฐ๋ฅ์ฑ์ ๋ฐ๊ฒฌํ๋ค.
๊ธ์ด ๊ธธ์ด์ ธ์ ์ด๋ฒ์๋ ์ ํฌ ์๊ฐ์ ๊ณผ์ ๋ค์ ์ ์ด ๋ณด์์ต๋๋ค.
๋ค์ ๊ธ์๋ ์์ ์์ธํ ๊ณผ์ ๊ณผ ์๋ํ๋ ๋ฐฉ๋ฒ๋ค์ ๋ ์ ์ด๋ณด๋ ค ํฉ๋๋ค.
ChatGPT ๋ฅผ ์ฒ์ ์จ๋ณด๋ฉด ๋ญ๋ ์ง ๋ค ํด์ค ๊ฒ ๊ฐ์ต๋๋ค.
๋ด ์
๋ฌด์๋ ์ ์ฉํ๋ฉด ๋ชจ๋ ๊ฒ ๋ค ์๋ํ ๋ ๊ฒ ๊ฐ์ ๊ธฐ๋ถ์ด ๋ค์ฃ .
ํ์ง๋ง ๋ง์ ๊ทธ๋ ๊ฒ ํ์ ๋ ๋ญ๊ฐ ๋ถ์กฑํ๊ณ ์์ฌ์ธ ๋๊ฐ ๋ง์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ ์์ง AI๋ ๋ฉ์๋ค... ํ๊ณ ์๊ฐํ์ฃ .
๊ฐ์ฅ ์ค์ํ ๊ฒ์ ๋ฌธ์ ๋ฅผ ์ ๋๋ก ์ดํดํ๊ณ AI ๋ฅผ ์ด๋ป๊ฒ ์ธ์ง ํ๋จํ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
PO๋ก ์ ํฅํ๋ฉด์ ๋ง์ด ํ๋ ๊ณ ๋ฏผ๋ค์ธ๋ฐ ์์ฆ AI๋ฅผ ํ์ฉํ๋ฉด์ ๋ ๋ง์ด ๊ณ ๋ฏผํ๊ณ ์์ต๋๋ค.
AI ๋ฅผ ์ด๋ป๊ฒ ์ธ์ง ๊ณ ๋ฏผ์ ํ๋ ๋ถ๋ค์ด ์๋ค๋ฉด ํจ๊ป ์๊ธฐ ๋๋๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
Repost from ์ ์ข
ํ์ ์ธ์ฌ์ดํธ
๊ณต๋ถ๋ฅผ ํ๋ฉด ํ ์๋ก ๋ตํ๊ธฐ ์ด๋ ค์ด AI์ ๋ฏธ๋. ์ธ๊ณ ์ต๊ณ ์ ํฌ์์๋ค ๋ํ ๋ง์ฐฌ๊ฐ์ง์ธ๊ฐ๋ณด๋ค. ํจ
https://blog.eladgil.com/p/things-i-dont-know-about-ai
Available now! Telegram Research 2025 โ the year's key insights 
