Continuous Learning_Startup & Investment
Kanalga Telegramโda oโtish
We journey together through the captivating realms of entrepreneurship, investment, life, and technology. This is my chronicle of exploration, where I capture and share the lessons that shape our world. Join us and let's never stop learning!
Ko'proq ko'rsatish2 299
Obunachilar
-224 soatlar
-147 kunlar
-4130 kunlar
Postlar arxiv
Frontier models keep getting more and more expensive to train, while commodity models drop in price each year as performance goes up (for example, it is probably ~5X cheaper to train GPT-3.5 equivalent now than 2 years ago)
AI code asisstant -> AI Coder
Chatbot -> Assistant -> Agent.
์ฒ์์ ํน์ ์ง๊ตฐ์ ์์ฐ์ฑ์ ๋์ด๋ ์์ค์ด์ง๋ง ์ฅ๊ธฐ์ ์ผ๋ก ๊ทธ ์ง๊ตฐ์ ์ํฌ ํ๋ก์ฐ๋ฅผ ๋์ฒดํด๊ฐ๋ฉด์ ์ฌ๋ฌ Agent๋ฅผ ๋ค๋ฃจ๋ 1๋ช
์ ์์ฐ์ฑ์ด ๊ธ๊ฒฉํ ์ค๋ฅด๋ ๊ฒ ์ผ๋ฐํ๋์ง ์์์ง.
We live in such strange times. Apple, a company famous for its secrecy, published a paper with staggering amount of details on their multimodal foundation model. Those who are supposed to be open are now wayyy less than Apple.
MM1 is a treasure trove of analysis. They discuss lots of architecture designs and even disclose that they train on GPT-4V-generated data. They provide exact scaling law coefficients (to 4 significant figures), MoE settings, and even optimal learning rate functions.
I have not seen this level of details from a big tech's whitepaper for a very, very long time. I'm also shocked they didn't put any effort on PR. MM1 just gets dropped, like a Mistral magnet link, on Arxiv out of nowhere.
Apple's so back! Paper: https://lnkd.in/g5hDiU2k
https://youtu.be/mqJ5YKlMIaM?si=ExGciQShPnWMF7oh
์์ฆ์ ์ด์:
์ฝ 40์ผ ์ ๋์ ๊ธฐ๊ฐ์ ์์ฆ์ผ๋ก ์ค์ ํ๊ณ , ์์ฆ๋ง๋ค ๋ช
ํํ ๋ชฉํ๋ฅผ ์ธ์ ๋ฌ์ฑํ๊ณ ์ ํจ.
์์ฆ์ด ๋๋๋ฉด ํ๊ณ ๋ฅผ ํตํด ์ฑ๊ณต ์์ธ์ ๋ถ์ํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก ํต์ฌ ๊ฐ์น๋ฅผ ์ ๋ฆฝํด ๋๊ฐ.
์์ฆ ์ฌ์ด์๋ ํผํธ์คํ(Pit-stop) ๊ธฐ๊ฐ์ ๋์ด ๋ฌธ์ ์ ๊ณผ ๊ธฐํ ์์ธ์ ํ์
ํ๊ณ ์ฐ์ ์์๋ฅผ ์ค์ .
๊ตฌ์ฑ์ ์ฃผ๋์ ๋ฌธ์ ํด๊ฒฐ:
๊ตฌ์ฑ์๋ค์ด ํจ๊ป ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ ํด๊ฒฐ ๋ฐฉ์์ ๋ชจ์ํ๋ ๊ฒ์ ์ค์ํจ.
์ค์ฟผ๋ ๋จ์๋ก ๊ตฌ์ฑ์๋ค์ด ์๋ฐ์ ์ผ๋ก ๋ชจ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํจ.
๋ํ๊ฐ ์ผ๋ฐฉ์ ์ผ๋ก ๋ฌธ์ ์ ํด๋ต์ ์ ์ํ๊ธฐ๋ณด๋ค๋, ๊ตฌ์ฑ์๋ค์ ์๊ฒฌ์ ์กด์คํ๊ณ ํฉ์๋ฅผ ์ด๋์ด ๋ด๊ณ ์ ํจ.
ํต์ฌ ๊ฐ์น ๊ธฐ๋ฐ์ ์์ฌ๊ฒฐ์ :
ํ์ฌ์ ํต์ฌ ๊ฐ์น๋ฅผ ์์ฌ๊ฒฐ์ ์ ๊ธฐ์ค์ผ๋ก ์ผ์.
๋ํ์ ๊ฒฐ์ ์ด๋ผ๋ ํต์ฌ ๊ฐ์น์ ๋ถํฉํ์ง ์์ผ๋ฉด ๊ตฌ์ฑ์๋ค์ด ์์ ๋กญ๊ฒ ์๊ฒฌ์ ๊ฐ์งํ ์ ์์.
์ด๋ฅผ ํตํด ์กฐ์ง์ ์ ์ฐ์ฑ๊ณผ ์ ์๋ ฅ์ ๋์ด๊ณ ์ ํจ.
์ ๋ณด์ ํฌ๋ช
ํ ๊ณต์ :
๊ฐ์ธ์ ์ฐ๋ด๊ณผ ๋ณด์์ ์ ์ธํ ๋ชจ๋ ์ ๋ณด๋ฅผ ๊ตฌ์ฑ์๋ค๊ณผ ๊ณต์ ํจ.
๊ฒฝ์์ง์ ๋ฒ์ธ ์นด๋ ์ฌ์ฉ ๋ด์ญ๊ณผ ํ์ฌ์ ์ฌ๋ฌด ์ํฉ ๋ฑ์ ๊ณต๊ฐํ์ฌ ๊ตฌ์ฑ์๋ค์ด ์ ๋ณด์ ๊ธฐ๋ฐํ ์์ฌ๊ฒฐ์ ์ ํ ์ ์๋๋ก ํจ.
์์จ๊ณผ ์ฑ
์์ ์กฐํ:
๊ตฌ์ฑ์๋ค์๊ฒ ๋ฌธ์ ํด๊ฒฐ์ ์์จ์ฑ์ ๋ถ์ฌํ๋, ๊ทธ์ ๋ฐ๋ฅธ ์ฑ
์๋ ํจ๊ป ์ง.
์ค์ค๋ก ๋ฌธ์ ๋ฅผ ์ฐพ๊ณ ํด๊ฒฐํ๊ณ ์ ํ๋ ๊ตฌ์ฑ์๋ค์ ์ด์ ๊ณผ ๋ชฐ์
์ ์ด๋์ด ๋ด๊ณ ์ ํจ.
๋ฒ์ง์์๋ AI ๊ฐ ๋ฏธํ
์ ๋ฐ์์ฐ๊ณ ์์ฝ์ ํ๊ณ ์์ต๋๋ค. ๊ณ์ฐํด ๋ดค๋๋ ํ๊ฑด๋น 300์ ์ ๋๋๋ผ๊ณ ์. ์ข์ ์์ฝ์ ๋ง๋ค๊ธฐ๊น์ง์ ๊ณผ์ ๊ณผ ์ํ์ฐฉ์ค๋ฅผ ๊ณต์ ํ๋ ค ํฉ๋๋ค.
โSTT(๋ฐ์์ฐ๊ธฐ) ํ๋ฆฌํฐ๊ฐ ๋๋ฌด ์ข์ง ์์์. ๊ฐ์ ํ ์ ์์๊น์?"
์ ๊ฐ ๋ฒ์ง์ ํจ๊ป ํ๊ณ ์ฒ์ ๋ฐ์ ์์ฒญ์
๋๋ค. ์ด๋ ๊น์ง๋ ์ฌ๋์ด ๋ฏธํ
์ ์์ฝํ๊ณ ๊ณต์ ํ๊ณ ์์๋๋ฐ ๋ฐ์์ฐ๊ธฐ ํ๋ฆฌํฐ๊ฐ ์ข์ง ์์ผ๋ ๋ฏธํ
์์์ ๋ค์ ๋๋ ค๊ฐ๋ฉด์ ๋ด์ผํ๋ ์์ฒญ๋ ๋ฆฌ์์ค๊ฐ ์๋น๋๊ณ ์์์ฃ . ๊ทธ๋์ ๋ฐ์์ฐ๊ธฐ๊ฐ ์ ๋๋ฉด ์์์ ๋ณด์ง ์๊ณ ํ
์คํธ๋ง ์ฝ์ด์ ์์ฝํ๋ฉด ๋๋ ํจ์ฌ ์๊ฐ์ด ์ค์ด๋ค ๊ฒ์ด๋ผ๋ ์๊ฐ์ด์์ฃ .
์ ์์์ ๋ด์ผํ๊ณ ๋ฐ์์ฐ๊ธฐ๋ฅผ ํด์ผ ํ๋๊ณ ์?
๋ฒ์ง๋ ์ธ์ฌ๊ฐ ํ์ํ ๊ณ ๊ฐ์ฌ์๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ์ธ์ฌ๋ฅผ ๋งค์นญํ๋ ํ๋ซํผ์
๋๋ค. ๊ทธ๋ ๊ธฐ์ ์ธ์ฌ๋ฅผ ์์ฒญํ ๊ณ ๊ฐ์ฌ์ ๊ผญ 30๋ถ ์ด์์ ๋ฏธํ
์ ํ๊ณ ๋ฌธ์ ๋ฅผ ์ ์ํ๋๋ฐ์. ์ด ๊ณผ์ ์์ ๊ณ ๊ฐ์ฌ์์ ๋งํ ๋ฌธ์ ์ ์ค์ ๋ฌธ์ ๊ฐ ๋ค๋ฅธ ๊ฒฝ์ฐ๊ฐ ๋ง์ฃ . ๊ทธ๋ ๊ธฐ์ ๊ณ ๊ฐ์ฌ์ ๊น์ด์๋ ๋ํ๋ฅผ ์ฃผ๊ณ ๋ฐ์ผ๋ฉฐ ๋ฌธ์ ๋ฅผ ๋ค์ ์ ์ํด์ผ ํ๊ณ ์ด ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ธ์ฌ ๋งค์นญ์ ์ค๋นํ๊ฒ ๋ฉ๋๋ค. ๊ทธ๋์ ๋น์ฐํ๊ฒ๋ ์ด ๋ฏธํ
๋ฐ์ดํฐ๊ฐ ์ ํฌ์๊ฒ๋ ๋๋ฌด๋๋ฌด ์ค์ํ ์ ๋ณด์ธ๊ฑฐ์ฃ .
< ๋ฌธ์ ํด๊ฒฐํ๋ฌ ๊ฐ๊ธฐ >
Step 1. ๋ฐ์์ฐ๊ธฐ ์ํ๊ฒ ๋ง๋ค๊ธฐ
์ฒ์ ๋ฐ์์ฐ๊ธฐ ๋ฌธ์ ๋ฅผ ๋ฐ์์๋๋ ๋ค์ํ STT ๋ชจ๋ธ์ ์ฐพ์๋ณด๊ธฐ ์์ํ์ด์. ์ ๊ฐ Data Scientist ๋ก๋ ์ค๋ซ๋์ ์ผํ๊ธฐ์ ์ข์ STT ๋ชจ๋ธ์ ์ฐพ์์ ์ ์ฉํ๋ฉด ์ถฉ๋ถํ ๊ฐ์ ํ ์ ์์ ๊ฒ ๊ฐ์๊ฑฐ๋ ์. ๊ทธ๋์ ํ๊น
ํ์ด์ค, ๊ตฌ๊ธ๋ฑ ์ฌ๋ฌ ๊ณณ์ ๋์๋ค๋๋ฉด์ ๋ชจ๋ธ์ ์ฐพ์๋ดค๊ณ OpenAI ์ Whisper ๋ชจ๋ธ์ด ๊ฐ์ฅ ๋ฐ์ด๋๋ค๊ณ ํ๋จํ ์ ์๊ฒ ๋์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ Whisper ๋ชจ๋ธ์ ๊ณต๊ฐ๋์ด ์์ด์ ๋ฌด๋ฃ๊ธฐ๋ ํ๊ณ ์. ํนํ Whisper ๋ ์ธ๊ฐ์ง ๋ชจ๋ธ์ด ์๋๋ฐ ๊ฐ์ฅ ํฐ large-v2 ๋ชจ๋ธ์ ์ฐ๋ฉด ํ๊ตญ์ด๋ ์์ฃผ ์ ๋ฐ์์ธ ์ ์๋ค๊ณ ํ๋๋ผ๊ณ ์. ๊ทธ๋์ ์ด๋์ ๋ ํ
์คํธ๋ฅผ ํด ๋ณด์๊ณ ์ด ๋ชจ๋ธ์ ์ฐ๊ธฐ๋ก ๊ฒฐ์ ํ์ต๋๋ค. Medium, small ๋ชจ๋ธ์ ์์ค์ ๊ธฐ๋์ ๋ฏธ์น์ง ๋ชปํ๋๋ผ๊ณ ์.
Step 2. ๋ชจ๋ธ ๊ตฌ์ถํ๊ธฐ
์ด์ ๋ชจ๋ธ์ด ์ ํด์ก์ผ๋ ์๋ฒ๋ฅผ ๊ตฌ์ถํด์ ๋ชจ๋ธ์ ์๋น์ค ํ ์ค๋น๋ฅผ ํ๋ฉด ๋ฉ๋๋ค. API ์๋ฒ๋ฅผ ๋ง๋ค๊ณ ๋ชจ๋ธ๊ณผ ์ฐ๋ํด์ ๋ฏธํ
์์ํ์ผ์ ๋ฐ์์ ์ฒ๋ฆฌํ์ Whisper ๋ชจ๋ธ์ด ๋ฐ์์ฐ๊ธฐ ํ ํ
์คํธ๋ฅผ ์๋ตํด์ฃผ๋ฉด ๋ฉ๋๋ค. ์ฅ๋น๋ฅผ ์ฐ์ ํด ๋ด๊ณ ๊ฝค ๋น์ผ ์ฅ๋น๋ฅผ ์ค๋นํด์ผ ํ๋๋ผ๊ณ ์. ๋น์ฉ์ด ๊ฝค ํฌ๊ฒ ํ์ํ ๊ฒ ๊ฐ์์ต๋๋ค. ์ด๋๋ถํฐ ๊ณ ๋ฏผ์ด ์์๋์์ต๋๋ค.
์ง๊ธ์ ํ๋ฃจ์ 10~20๊ฐ์ ๋ฏธํ
์ ์ฒ๋ฆฌํ ํ
๋ฐโฆ ์ด๋ ๊ฒ ๊ตฌ์ถํ๊ณ ๋น์ฉ์ ์ฐ๋ ๊ฒ ๋ง๋?
๋ด๊ฐ ์ง๊ธ ํด๊ฒฐํ๋ ค๋ ๋ฌธ์ ์ ๊ฐ์ฅ ์ ์ ํ ๋ฐฉ๋ฒ์ ์ฐพ์ ๊ฒ์ด ๋ง๋?
์ ๊ฐ ํด์๋ ์ผ๋ค์ ์์ฌํ๊ธฐ ์์ํ์ต๋๋ค.
Reset. ๋ค์ ์ฒ์๋ถํฐ ์์ํ๊ธฐ
โSTT(๋ฐ์์ฐ๊ธฐ) ํ๋ฆฌํฐ๊ฐ ๋๋ฌด ์ข์ง ์์์. ๊ฐ์ ํ ์ ์์๊น์?
์ ๊ฐ ๋ฐ์ ์์ฒญ์ ๋ถ๋ช
์ด๊ฒ์ด์์ต๋๋ค. ์ด ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ์ด๋ผ๋ฉด ์ ๋ ์ ์ ํ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๊ณ ์์์ต๋๋ค.
ํ์ง๋ง, ์ ๋ ๋ฌธ์ ๋ฅผ ๋ ๊น์ด ์ดํด๋ณด์ง ๋ชปํ์ต๋๋ค.
ํ์ด ํ์ํ ๊ฒ์ ๋จ์ํ โSTT ๊ณ ๋ํโ ๊ฐ ์๋์์ต๋๋ค.
ํ์ด ํ์ํ ๊ฒ์ ๋ชจ๋ ๋ฏธํ
์ โ์ ๊ทผ ํ๊ธฐ ์ฌ์ด ํํ๋ก ๋ณํ(STT)โ ํ๊ณ โ์ ์ ๋ฆฌ(์์ฝ)โ ํ๋ ๊ฒ์ด์์ต๋๋ค.
๊ทธ๋์ผ ๊ทธ ์ ๋ณด๋ฅผ ๋ฒ์งํ์ ๋ณธ์
์ธ "๊ณ ๊ฐ์ฌ์ ์๊ตฌ์ฌํญ์ ์ดํดํ๊ณ ์ ์ ํ ์ธ์ฌ๋ฅผ ๋งค์นญํ๋ ์ผ"์ ํ์ฉํ ์ ์๊ธฐ ๋๋ฌธ์
๋๋ค.
์ด ๋๋ถํฐ ์ ๋ STT๋ชจ๋ธ์ด ์๋๋ผ ๋ฒ์ง๊ฐ ๊ณ ๊ฐ์ฌ๋ฅผ ๋ง๋๊ณ ์ธ์ฌ๋ฅผ ์ถ์ฒํ๋ ๋ชจ๋ ์๊ฐ์ AI๋ฅผ ์ด์ฉํด์ ๋ ํจ์จํ ํ ์ ์์๊น ๊ณ ๋ฏผํ๊ธฐ ์์ํ์ต๋๋ค.
๊ทธ๋์ ์ข์ ๋ฐ์์ฐ๊ธฐ์ ์์ฝ์ ๋ง๋ค๊ธฐ ์ํด ์๋ ๊ณผ์ ๋ค์ ์งํํ๊ฒ ๋ฉ๋๋ค.
1. ChatGPT API (STT, Chat Completion) ๋ฅผ ์ ๊ทน ์ฌ์ฉํ๋ค
2. API ๋ฅผ ์ ์ฐ๊ธฐ ์ํด์ ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ๋ฅผ ๊ฑฐ๊ธฐ์ ๋ง์ถ๋ค
3. ์์ฝ ์๋ํ ํ๊ธฐ ์ํด ๋ฏธํ
์๋ฃจ์
์ ์ฝ๋ผ๋ณด์์ ์ค์ผ๋ก ๋ฐ๊พผ๋ค
4. ํ์๋ค์ ํผ๋๋ฐฑ์ ๋ค์ผ๋ฉด์ ChatGPT ํ๋กฌํํธ๋ฅผ ๋ฐ๊พธ๊ณ ์ฌ๋ฌ ๋ฒ์ ์ ํ
์คํธ ํ๋ค.
5. ์ฌ๋์ ์ด์ฉํด์ ์ฝ๊ฒ ์ ๊ทผํ ์ ์๋๋ก ๋ง๋ ๋ค.
6. ์์ธ ๋ฐ์ดํฐ๋ก ๋ ํฐ ๊ฐ๋ฅ์ฑ์ ๋ฐ๊ฒฌํ๋ค.
๊ธ์ด ๊ธธ์ด์ ธ์ ์ด๋ฒ์๋ ์ ํฌ ์๊ฐ์ ๊ณผ์ ๋ค์ ์ ์ด ๋ณด์์ต๋๋ค.
๋ค์ ๊ธ์๋ ์์ ์์ธํ ๊ณผ์ ๊ณผ ์๋ํ๋ ๋ฐฉ๋ฒ๋ค์ ๋ ์ ์ด๋ณด๋ ค ํฉ๋๋ค.
ChatGPT ๋ฅผ ์ฒ์ ์จ๋ณด๋ฉด ๋ญ๋ ์ง ๋ค ํด์ค ๊ฒ ๊ฐ์ต๋๋ค.
๋ด ์
๋ฌด์๋ ์ ์ฉํ๋ฉด ๋ชจ๋ ๊ฒ ๋ค ์๋ํ ๋ ๊ฒ ๊ฐ์ ๊ธฐ๋ถ์ด ๋ค์ฃ .
ํ์ง๋ง ๋ง์ ๊ทธ๋ ๊ฒ ํ์ ๋ ๋ญ๊ฐ ๋ถ์กฑํ๊ณ ์์ฌ์ธ ๋๊ฐ ๋ง์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ ์์ง AI๋ ๋ฉ์๋ค... ํ๊ณ ์๊ฐํ์ฃ .
๊ฐ์ฅ ์ค์ํ ๊ฒ์ ๋ฌธ์ ๋ฅผ ์ ๋๋ก ์ดํดํ๊ณ AI ๋ฅผ ์ด๋ป๊ฒ ์ธ์ง ํ๋จํ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
PO๋ก ์ ํฅํ๋ฉด์ ๋ง์ด ํ๋ ๊ณ ๋ฏผ๋ค์ธ๋ฐ ์์ฆ AI๋ฅผ ํ์ฉํ๋ฉด์ ๋ ๋ง์ด ๊ณ ๋ฏผํ๊ณ ์์ต๋๋ค.
AI ๋ฅผ ์ด๋ป๊ฒ ์ธ์ง ๊ณ ๋ฏผ์ ํ๋ ๋ถ๋ค์ด ์๋ค๋ฉด ํจ๊ป ์๊ธฐ ๋๋๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
Repost from ์ ์ข
ํ์ ์ธ์ฌ์ดํธ
๊ณต๋ถ๋ฅผ ํ๋ฉด ํ ์๋ก ๋ตํ๊ธฐ ์ด๋ ค์ด AI์ ๋ฏธ๋. ์ธ๊ณ ์ต๊ณ ์ ํฌ์์๋ค ๋ํ ๋ง์ฐฌ๊ฐ์ง์ธ๊ฐ๋ณด๋ค. ํจ
https://blog.eladgil.com/p/things-i-dont-know-about-ai
Endi mavjud! Telegram Tadqiqoti 2025 โ yilning asosiy insaytlari 
