Continuous Learning_Startup & Investment
Kanalga Telegramโda oโtish
We journey together through the captivating realms of entrepreneurship, investment, life, and technology. This is my chronicle of exploration, where I capture and share the lessons that shape our world. Join us and let's never stop learning!
Ko'proq ko'rsatish2 309
Obunachilar
Ma'lumot yo'q24 soatlar
-87 kunlar
-3130 kunlar
Postlar arxiv
๋ฏธ๊ตญ ์ต์ด ์๋์ฐจ ํ์ฌ: 1895๋
Duryea Motor Wagon Company.
์ดํ ์ฆ๊ฐ ์ถ์ธ: 1900๋
์ ๊น์ง 34๊ฐ, 19001909๋
233๊ฐ, 19101919๋
168๊ฐ์ ์ ๊ท ์
์ฒด ์ค๋ฆฝ.
ํ์ง๋ง 1920๋
๋ ์ดํ ๊ธ๊ฒฉํ consolidation(ํตํํฉ)๋๋ฉด์, **โ๋น
3โ(GM, ํฌ๋, ํฌ๋ผ์ด์ฌ๋ฌ)**๊ฐ ์์ฅ์ ์ฅ์
.
ํต์ฌ ํฌ์ธํธ:
โ์ ์๋์ฐจ ํ์ฌโ ์ถํ ์์ฒด๋ ์ค์์ง๋ง, ๊ทธ ํ์๋ ์๋์ฐจ๊ฐ ์ด๋ํ ์ฌํ์ ๋ณํ(๊ต์ธ ํ์ฐ, ๋น
๋ฐ์ค ๋ฆฌํ
์ผ, ๊ตํต๋ฌธํ ๋ฑ)๋ ํจ์ฌ ์ปค์ง.
์ฆ, โ์ฐ์
์ด ์ฑ์๋๊ณ ํ์ ๊ธฐ์
์ค๋ฆฝ์ด ์ค์ด๋ ๋คโ ํด์ ์๋์ฐจ ์์ฒด์ ์ํฅ๋ ฅ์ด ์ค์ด๋๋ ๊ฑด ์๋์๋ค.
OpenAI์ Operator ๊ฐ์ ํ๋ก์ ํธ๋ ๋์งํธ ์ธ๊ณ์์ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด์ด ๋ฌผ๋ฆฌ์ ์ธ๊ณ์์ ํ๋ ์ญํ ๊ณผ ์ ์ฌํฉ๋๋ค.
์ฆ, ์ธ๊ฐ์ ์ํด ์ค๊ณ๋ ์
์ถ๋ ฅ ์ธํฐํ์ด์ค(I/O interface)(์: ๋ชจ๋ํฐ, ํค๋ณด๋, ๋ง์ฐ์ค ๋๋ ์ธ๊ฐ์ ์ ์ฒด)๋ฅผ ํตํด ์ ์ง์ ์ผ๋ก ๋ฒ์ฉ์ ์ธ ์์
์ ์ํํ ์ ์๋ ์ผ๋ฐ์ ์ธ ์ค์ ์ ๊ฐ์ถ ์์คํ
์
๋๋ค.
์ด๋ฌํ ์์คํ
์ด ๋์
๋๋ฉด ์ ์ง์ ์ผ๋ก ํผํฉ๋ ์์จ์ฑ(mixed autonomy) ์ธ๊ณ๊ฐ ํ์ฑ๋๋ฉฐ, ์ธ๊ฐ์ **ํ์ ์์ค ์๋ํ(low-level automation)**์ ์์ ๊ฐ๋
์(high-level supervisor) ์ญํ ์ ํ๊ฒ ๋ฉ๋๋ค.
์ด๋ ๋ง์น ์ด์ ์๊ฐ ์์จ์ฃผํ ์์คํ
(Autopilot)์ ๋ชจ๋ํฐ๋งํ๋ ๊ฒ๊ณผ ๋น์ทํ ๊ตฌ์กฐ์
๋๋ค.
์ด๋ฌํ ๋ณํ๋ ๋ฌผ๋ฆฌ์ ์ธ๊ณ๋ณด๋ค ๋์งํธ ์ธ๊ณ์์ ํจ์ฌ ๋ ๋น ๋ฅด๊ฒ ์งํ๋ ๊ฒ์
๋๋ค.
๊ทธ ์ด์ ๋ ๋นํธ๋ฅผ ์ ํ(flipping bits)ํ๋ ๊ฒ์ด ์์(atom)๋ฅผ ์ด๋์ํค๋ ๊ฒ๋ณด๋ค ์ฝ 1000๋ฐฐ ์ ๋ ดํ๊ธฐ ๋๋ฌธ์
๋๋ค.
๊ทธ๋ฌ๋ ์์ฅ ๊ท๋ชจ ๋ฐ ๊ธฐํ๋ ๋ฌผ๋ฆฌ์ ์ธ๊ณ์์ ํจ์ฌ ๋ ํฌ๋ค๊ณ ๋๊ปด์ง๋๋ค.
OpenAI ์ด์ฐฝ๊ธฐ ์์ , ์ฐ๋ฆฌ๋ ์ด๋ฏธ ์ด ์์ด๋์ด๋ฅผ ์ฐ๊ตฌํ ์ ์ด ์์ต๋๋ค.
(์: Universe ๋ฐ World of Bits ํ๋ก์ ํธ)
ํ์ง๋ง ๊ทธ๋๋ ์๋ชป๋ ์์๋ก ์งํ๋์๊ณ , **๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)**์ด ๋จผ์ ๋ฑ์ฅํด์ผ ํ์ต๋๋ค.
์์งํ ๋งํด, ์ง๊ธ๋ ์ด ๊ฐ๋
์ด ์์ ํ ์ค๋น๋์๋์ง 100% ํ์ ํ ์๋ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด, **๋ฉํฐ๋ชจ๋ฌ(Multimodal: ์ด๋ฏธ์ง, ์์, ์ค๋์ค ๋ฑ)**์ด ์ง๋ 1~2๋
๊ฐ LLM๊ณผ ํตํฉ๋์์ง๋ง,
๋๋ถ๋ถ ์ด๋ํฐ(adapter) ๋ฐฉ์์ผ๋ก ์ต์ง๋ก ๋ถ์ฌ์ง ์์ค์
๋๋ค.
๋ ๋์ ์ ์, ์ฐ๋ฆฌ๋ ์์ง **๋งค์ฐ ๊ธด ์์
์ฃผ๊ธฐ(very long task horizon)**๋ฅผ ๋ค๋ฃฌ ๊ฒฝํ์ด ์์ต๋๋ค.
์๋ฅผ ๋ค์ด, ๋น๋์ค๋ ์์ฒญ๋ ์์ ์ ๋ณด๋ฅผ ํฌํจํ๊ณ ์๊ธฐ ๋๋ฌธ์,
ํ์ฌ์ ๋งฅ๋ฝ ์ฐฝ(context window) ๊ฐ๋
๋ง์ผ๋ก ๋ชจ๋ ์ ๋ณด๋ฅผ ์ ์ฅํ๊ณ ์ฒ๋ฆฌํ ์ ์์์ง ํ์ ์ด ์์ต๋๋ค.
์๋ง๋ ์ฌ๊ธฐ์์ ํ๋ ๊ฐ์ง ํ์ ์ ์ธ ๋ํ๊ตฌ๊ฐ ํ์ํ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
๋ด ํ์๋ผ์ธ์์๋ ์ฌ๋๋ค์ด **โ2025๋
์ด ์์ด์ ํธ(agent)์ ํดโ**๊ฐ ๋ ๊ฒ์ด๋ผ๊ณ ์ด์ผ๊ธฐํ๊ณ ์์ต๋๋ค.
ํ์ง๋ง ๊ฐ์ธ์ ์ผ๋ก๋ 2025~2035๋
์ด โ์์ด์ ํธ์ 10๋
โ์ด ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
์ค์ ๋ก ์ด ๊ฐ๋
์ ํ์ค์์ ์๋ํ๊ฒ ๋ง๋ค๊ธฐ ์ํด์๋
๋ฐฉ๋ํ ์ฐ๊ตฌ ๋ฐ ๊ฐ๋ฐ ์์
์ด ํ์ํ์ง๋ง, ๊ถ๊ทน์ ์ผ๋ก๋ ๊ฐ๋ฅํ ๊ฒ์
๋๋ค.
์ค๋๋ , OpenAI์ Operator๋ DoorDash์์ ์ ์ฌ์ ์ฐพ์์ฃผ๊ฑฐ๋, ํธํ
์ ์์ฝํ๋ ๊ฒ ์ ๋๋ฅผ ๋๋๋ก, ํน์ ๊ฐ์ ํ ํด๋ผ ์ ์์ต๋๋ค.
๋ด์ผ, ์ฐ๋ฆฌ๋ Operator ์์ด์ ํธ๋ฅผ ์ฌ๋ฌ ๊ฐ ์กฐ์งํํ์ฌ ์ฅ๊ธฐ์ ์ธ ์์
์ ์ํํ๋๋ก ๋ง๋ค ์ ์์ต๋๋ค.
(์: ํ๋์ ํ์ฌ ์ ์ฒด๋ฅผ ์ด์ํ๋ ๊ฒ๊ณผ ๊ฐ์ ๋ณต์กํ ์์
)
๋น์ ์ CEO๊ฐ ๋์ด ํ ๋ฒ์ 10๊ฐ์ Operator๋ฅผ ๊ฐ๋
ํ ์๋ ์์ต๋๋ค.
๋๋๋ก ์ง์ ๊ฐ์
ํ์ฌ ๋ฌธ์ ๊ฐ ๋๋ ๋ถ๋ถ์ ํด๊ฒฐํ๊ณ , ์ ๋ฐ์ ์ธ ์ด์์ ์กฐ์จํ๋ ๋ฐฉ์์ด ๋ ์๋ ์๊ฒ ์ฃ .
๊ทธ๋ ๊ฒ ๋๋ฉด ๊ต์ฅํ ํฅ๋ฏธ๋ก์ด ๋ฏธ๋๊ฐ ํผ์ณ์ง ๊ฒ์
๋๋ค.
https://x.com/karpathy/status/1882544526033924438?s=46&t=h5Byg6Wosg8MJb4pbPSDow
๋ฅ๋ฌ๋์ ๊ทธ ์ด๋ค AI ์๊ณ ๋ฆฌ์ฆ๋ณด๋ค๋ ์ ๋ก ์์ด ์์ฒญ๋ ์ฐ์ฐ๋ ฅ์ ์๊ตฌํ๋, ์ ์ค์ ์ธ ํ์์ ๊ฐ์ง ์กด์ฌ๋ผ๊ณ ๋งํ ์ ์์ต๋๋ค. ํญ์ ์ด๋ฅผ 100% ํ์ฉํ๋ ๊ฒ์ ์๋ ์๋ ์์ง๋ง, ์ฅ๊ธฐ์ ์ผ๋ก ๋ฌ์ฑ ๊ฐ๋ฅํ ์ง๋ฅ์ ์ํ์ ์ด ์ฐ์ฐ๋ ฅ(compute)์ ์ํด ๊ฒฐ์ ๋๋ค๊ณ ์๊ฐํ๋ฉฐ, ์ด์ ๋ฐํ๋ ๋ด๊ธฐ๋ฅผ ํ์ง๋ ์์ ๊ฒ์
๋๋ค. ์ด๋ ๋จ์ํ ๊ฐ๋ณ์ ์ธ ์ต์ข
ํ๋ จ ๊ณผ์ ์์๋ง์ด ์๋๋ผ, ๋ชจ๋ ์๊ณ ๋ฆฌ์ฆ ํ์ ์ ๊ธฐ๋ฐ์ด ๋๋ ๋ณด์ด์ง ์๋ ํ์ ๋ฐ ์คํ ์์ง ์ ์ฒด์๋ ํด๋น๋ฉ๋๋ค.
์ ํต์ ์ผ๋ก ๋ฐ์ดํฐ๋ ์ฐ์ฐ๋ ฅ๊ณผ ๋ณ๊ฐ์ ์์๋ก ๊ฐ์ฃผ๋์ด ์์ง๋ง, ์ค์ ๋ฐ์ดํฐ๋ ์๋น ๋ถ๋ถ ์ฐ์ฐ๋ ฅ์ ์ฐ๋ฌผ์
๋๋ค. ์ฐ๋ฆฌ๋ ์ฐ์ฐ๋ ฅ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค. ๊ทธ๊ฒ๋ ์์ฒญ๋๊ฒ ๋ง์ด์. ์ด๋ฅผ โํฉ์ฑ ๋ฐ์ดํฐ ์์ฑ(synthetic data generation)โ์ด๋ผ๊ณ ๋ถ๋ฅด์ง๋ง, ์ฌ์ค โํฉ์ฑ ๋ฐ์ดํฐ ์์ฑโ๊ณผ โ๊ฐํํ์ต(reinforcement learning)โ ์ฌ์ด์๋ ๋งค์ฐ ๊น์ ์ฐ๊ด์ฑ(์ฌ์ง์ด ๋๋ฑ์ฑ)์ด ์กด์ฌํฉ๋๋ค. ๊ฐํํ์ต์์ ์ํ์ฐฉ์ค(trial-and-error)๋ฅผ ํตํ ํ์ต ๊ณผ์ ์์ โ์ํ(trial)โ์ ๋ชจ๋ธ์ด ํฉ์ฑ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ณผ์ ์ด๋ฉฐ, โ์ค๋ฅ(error)โ ๋๋ ๋ณด์(reward)์ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ์ด ๋ค์ ํ์ตํฉ๋๋ค. ๋ฐ๋๋ก, ํฉ์ฑ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ํ ์ด๋ฅผ ๋ญํนํ๊ฑฐ๋ ํํฐ๋งํ๋ ๊ณผ์ ์ 0-1 ์ด์ ํจ์(advantage function)์ ์ฌ์ค์ ๋์ผํฉ๋๋ค. ์ฆ, ์ถํํฉ๋๋ค! ์ฌ๋ฌ๋ถ์ ์ง๊ธ ํํธ์๋(?) ๊ฐํํ์ต์ ํ๊ณ ๊ณ์ ๊ฒ๋๋ค.
๋ง์ง๋ง์ผ๋ก ํ๋ ๋. ์ด๊ฒ ๋ช
ํํ ์ฌ์ค์ธ์ง ๋ชจ๋ฅด๊ฒ ์ง๋ง, ์ธ๊ฐ ์์ด๋ค์ ํ์ต ๋ฐฉ์๊ณผ ๋ฅ๋ฌ๋์ ํ์ต ๋ฐฉ์์๋ ๋ ๊ฐ์ง ์ฃผ์ ์ ํ์ด ์์ต๋๋ค.
1. ๋ชจ๋ฐฉ ํ์ต(Imitation Learning) โ ๋ณด๊ณ ๋ฐ๋ผ ํ๊ธฐ (์ฆ, ์ฌ์ ํ๋ จ(pretraining)๊ณผ ์ง๋ ํ์ต์ ํตํ ํ์ธํ๋)
2. ์ํ์ฐฉ์ค ํ์ต(Trial-and-Error Learning) โ ๊ฐํํ์ต (Reinforcement Learning)
๋ด๊ฐ ๊ฐ์ฅ ์ข์ํ๋ ๋จ์ํ ์์๋ **์ํ๊ณ (AlphaGo)**์
๋๋ค.
1. ์ํ๊ณ ๋ ๋จผ์ ์ ๋ฌธ๊ฐ๋ค์ ํ๋ ์ด๋ฅผ ๋ชจ๋ฐฉํ๋ฉด์ ํ์ตํฉ๋๋ค.
2. ์ดํ์๋ ๊ฐํํ์ต์ ํตํด ์ค์ค๋ก ๊ฒ์์์ ์ด๊ธฐ๋ ๋ฒ์ ๋ฐฐ์๋๋ค.
๊ทธ๋ฆฌ๊ณ ๋ฅ๋ฌ๋์์ ๋์จ ๊ฑฐ์ ๋ชจ๋ ์ถฉ๊ฒฉ์ ์ธ ๊ฒฐ๊ณผ๋ค, ์ฆ ๋ง๋ฒ ๊ฐ์ ์๊ฐ๋ค์ ์์ฒ์ ํญ์ **2๋ฒ(๊ฐํํ์ต)**์์ ๋์ต๋๋ค. 2๋ฒ์ด ํจ์ฌ ๋ ๊ฐ๋ ฅํฉ๋๋ค. 2๋ฒ์ด ๋ฐ๋ก ์ฐ๋ฆฌ๋ฅผ ๋๋ผ๊ฒ ํฉ๋๋ค. 2๋ฒ์ด ์ฐ๋ฆฌ๊ฐ โ๋ธ๋ ์ดํฌ์์(Breakout)โ ๊ฒ์์์ ๊ณต์ ๋ธ๋ก ๋ค์ชฝ์ผ๋ก ํ๊ฒจ ์ ์๋ฅผ ์ป๋ ์ ๋ต์ ๋ฐ๊ฒฌํ๊ฒ ๋ง๋๋ ์๋ฆฌ์
๋๋ค. 2๋ฒ์ด ์ํ๊ณ ๊ฐ ์ด์ธ๋์ ์ด๊ธธ ์ ์๊ฒ ๋ง๋ ๋ฐฉ๋ฒ์
๋๋ค. ๊ทธ๋ฆฌ๊ณ 2๋ฒ์ด ๋ฐ๋ก DeepSeek์ด๋ o1 ๊ฐ์ ๋ชจ๋ธ์ด ์์ ์ ๊ฐ์ ์ ์ฌํ๊ฐํ๊ณ , ํํดํ๊ณ , ๋ค๋ฅธ ์ ๋ต์ ์๋ํ๋ ๊ฒ์ด ํจ๊ณผ์ ์ด๋ผ๋ ๊ฒ์ ๋ฐ๊ฒฌํ๋ ์๊ฐ์
๋๋ค.
์ฆ, 2๋ฒ์ ์ด ๋ชจ๋ธ์ด ์ฒด์ธ ์ค๋ธ ์ํธ(Chain of Thought) ๋ฐฉ์์ผ๋ก ๋ฌธ์ ํด๊ฒฐ ์ ๋ต์ ๊ตฌ์ถํ๋ ๋ฐฉ์์
๋๋ค. ๋ชจ๋ธ์ด ์ค์ค๋ก ์๊ฐ์ ๊ต์ฐจํ๋ฉฐ ๊ณ ๋ฏผํ๋ ๋ฐฉ์์
๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๋ฐ ์ฌ๊ณ ๊ณผ์ ์ *์์ฐ์ ์ผ๋ก ๋ฐ์ํ๋ ํ์(emergent phenomenon)*์ด๋ฉฐ, ์ด๋ ์ ๋ง ๋๋๊ณ ์ธ์์ ์ด๋ฉฐ, ๊ณต๊ณต ์์ญ์์ ๋ฌธ์ํ๋ ํํ๋ก ํ์ธํ ์ ์๋ ์์ ํ ์๋ก์ด ๊ฐ๋
์
๋๋ค.
์ด๋ฌํ ์ฌ๊ณ ๋ฐฉ์์ 1๋ฒ(๋ชจ๋ฐฉ ํ์ต)์ผ๋ก๋ ๊ฒฐ์ฝ ๋ฐฐ์ธ ์ ์์ต๋๋ค. ์๋ํ๋ฉด ๋ชจ๋ธ์ ์ธ์ง ๋ฐฉ์๊ณผ ์ธ๊ฐ ๋ฐ์ดํฐ ๋ผ๋ฒจ๋ฌ์ ์ธ์ง ๋ฐฉ์์ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์
๋๋ค. ์ธ๊ฐ์ ์ด๋ฌํ ๋ฌธ์ ํด๊ฒฐ ์ ๋ต์ ์ ํํ๊ฒ ์ฃผ์ ๋ฌ๊ฑฐ๋, ๊ทธ ์ ๋ต์ด ์ด๋ป๊ฒ ๋ณด์ด๋์ง์กฐ์ฐจ ์ ์ํ ์ ์์ต๋๋ค. ๊ฒฐ๊ตญ ์ด๋ฌํ ์ ๋ต๋ค์ ๊ฐํํ์ต์ ๊ฑฐ์น๋ ๊ณผ์ ์์ ๊ฒฝํ์ ์ผ๋ก, ๊ทธ๋ฆฌ๊ณ ํต๊ณ์ ์ผ๋ก ์ ์ฉํ ๊ฒ์ผ๋ก ๋ฐ๊ฒฌ๋์ด์ผ ํฉ๋๋ค.
(์ง์ง ๋ง์ง๋ง ์ฐธ๊ณ ์ฌํญ: ๊ฐํํ์ต(RL)์ ๊ฐ๋ ฅํ์ง๋ง, **๊ฐํํ์ต์ ํ์ฉํ ์ธ๊ฐ ํผ๋๋ฐฑ(RLHF)**์ ๊ทธ๋ ์ง ์์ต๋๋ค. RLHF๋ RL์ด ์๋๋๋ค. ์ด์ ๋ํ ๋ณ๋์ ๊ธด ๋ถ๋ง์ด ์ด์ ํธ์์ ์์ต๋๋ค.)
https://x.com/karpathy/status/1883941452738355376?s=46&t=h5Byg6Wosg8MJb4pbPSDow
์คํ ์๋ ์์ญ์์ ์ด์ ์ ์ฌํ ๊ฒ์ ์ฒซ ๋ฒ์งธ ์ด๊ธฐ ๋ชจ์ต์ ๋ณด๊ณ ์์ต๋๋ค. ๋ชจ๋ธ์ ๋ค์ํ ์ํ/์ฝ๋ ๋ฑ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ณผ์ ์์ ์ธ๊ฐ์ ๋ด์ ๋
๋ฐฑ๊ณผ ์ ์ฌํ ์ ๋ต์ ๋ฐ๊ฒฌํ๋๋ฐ, ์ด๋ ๋ชจ๋ธ์ ์ง์ ํ๋ก๊ทธ๋๋ฐํ๊ธฐ๋ ๋งค์ฐ ์ด๋ ต๊ณ (/๋ถ๊ฐ๋ฅํฉ๋๋ค) ๋ถ๊ฐ๋ฅํฉ๋๋ค. ์ ๋ ์ด๋ฅผ '์ธ์ง ์ ๋ต'์ด๋ผ๊ณ ๋ถ๋ฅด๋๋ฐ, ๋ค์ํ ๊ฐ๋์์ ๋ฌธ์ ์ ๊ทผํ๊ธฐ, ๋ค์ํ ์์ด๋์ด ์๋ํ๊ธฐ, ์ ์ถ ์ฐพ๊ธฐ, ์ญ์ถ์ ํ๊ธฐ, ์ฌ๊ฒํ ํ๊ธฐ ๋ฑ์ด ์ด์ ํด๋นํฉ๋๋ค. ์ด์ํ๊ฒ ๋ค๋ฆฌ๊ฒ ์ง๋ง, LLM์ด ๋ ๋์ ์ฌ๊ณ ๋ฐฉ์, ๋ฌธ์ ํด๊ฒฐ ๋ฐฉ์, ์ฌ๋ฌ ๋ถ์ผ์ ์์ด๋์ด๋ฅผ ์ฐ๊ฒฐํ๋ ๋ฐฉ์์ ๋ฐ๊ฒฌํ ์ ์๋ค๋ ๊ฒ์ ๊ทธ๋ด๋ฏํ ์ผ์ด๋ฉฐ, ๋์ด์ผ๋ณด๋ฉด ๋๋๊ณ ๋นํฉ์ค๋ฝ์ง๋ง ์ฐฝ์์ ์ด๊ณ ๊ธฐ๋ฐํ ๋ฐฉ์์ผ๋ก ๊ทธ๋ ๊ฒ ํ ์ ์์ต๋๋ค. ์ต์ ํ๊ฐ ์ฐ๋ฆฌ๊ฐ ์ดํดํ ์ ์์ง๋ง ๋ฌธ์ ํด๊ฒฐ์ ๋ ํจ์จ์ ์ด๊ฑฐ๋ ํจ๊ณผ์ ์ธ ์์ ๋ง์ ์ธ์ด๋ฅผ ๋ฐ๋ช
ํ๋ ๊ฒ์ ๊ทธ๋ด๋ฏํ ์ผ์
๋๋ค(์ ์ํ๋๋ค๋ฉด ๊ทธ๋ด ๊ฐ๋ฅ์ฑ๋ ์์ต๋๋ค). ๊ฐํ ํ์ต์ ๊ธฐ๋ฌํจ์ ์์น์ ์ผ๋ก ํ๊ณ๊ฐ ์์ต๋๋ค.
์์ง ๋ฌด๋ธ 37์ ์์ํ๋ ๊ธฐ์ ์ ๋ณธ ์ ์ด ์๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ด๋ค ๋ชจ์ต์ผ์ง ๋ชจ๋ฅด๊ฒ ์ต๋๋ค. ์์ง์ ์ด๊ธฐ ๋จ๊ณ์ด๊ณ ์์ง๋์ด๋ง๊ณผ ์ฐ๊ตฌ ์ธก๋ฉด์์ ์์ผ๋ก ํด์ผ ํ ์ผ์ด ๋ง๋ค๊ณ ์๊ฐํฉ๋๋ค. ํ์ง๋ง ๊ธฐ์ ์ด ์ด๋ฅผ ์ฐพ์๋ผ ์ ์๋ ๊ถค๋์ ์ค๋ฅธ ๊ฒ ๊ฐ์ต๋๋ค.
https://x.com/karpathy/status/1884336943321997800?s=46&t=h5Byg6Wosg8MJb4pbPSDow
1. ํ๊ตญ๋ ์ง๊ธ ์ด๋ฐ ๋ชจ๋ธ์ ๊ณต๊ฐํ ์ ์๋ ์ํฉ์ด์๋ค๋ฉด.
2. Compute Multiplier์ ๋ฐ๊ฒฌ์ด ์ด์ ๋ง์ ์์ GPU๊ฐ ํ์ํ์ง ์๋ค๋ ๋ฐ์์ผ๋ก ์ด์ด์ง ์ค์ ๋ชฐ๋๋ค. ๊ทธ๋ฐ ์๋ฏธ๊ฐ ์๋๋ผ๊ณ ๋งํ๊ณ ์ถ์ ์ถฉ๋์ด ๋ค์ง๋ง ๊ทธ๊ฒ ๋ฑํ ์๋ฏธ๊ฐ ์์๊น ์ถ๋ค.
3. ์ ๊ธฐ์ธ์ ์ฐจ์ด๋ฅผ ๊ณ ๋ คํ๋๋ผ๋ ๋ฏธ๊ตญ์ชฝ LLM API ๊ฐ๊ฒฉ์๋ ๋ง์ง์ด ๊ฝค ๋ถ์ด์์ ๊ฒ์ด๋ผ๋ ์๊ฐ. ์ค๊ตญ ๋ด์์ ๊ฐ๊ฒฉ ๊ฒฝ์์ด ๋ถ์ ๊ฒ์ฒ๋ผ LLM API ๊ฐ๊ฒฉ์ ์์ฐฉ์ด ์ผ์ด๋ ์ง๋.
4. AI/MLํ์ ํจํด ํ๋. ๋ฐ์ ์๋๊ฐ ์๋ ๋น ๋ฅด๋ค๋ณด๋ ํน์ ์์ ์ ๊ธฐ์ ๋ก ์์ต ์ฐฝ์ถ์ ์๋ํ๋ฉด ์ฐฝ์ถ์ ์๋ ๋ ์ ๋์ ์ด๋ฏธ ๋ค์ ์์ ์ ๊ธฐ์ ์ด ์ด์ ๊ธฐ์ ์ ์ธ๋ชจ ์๊ฒ ๋ง๋ ๋ค. ๋ฐ๋ผ์ - ๋ ํ๋ ์ด์ผ๊ธฐ์ธ ์ง๊ธ ๊ธฐ์ ์ ๊ทธ๋ ๊ฒ ์ธ๋ชจ ์์ง ์๋ค๋ ๊ฒ์ ๋ํด - ํ์ฌ์ ์์ต์ ๊ตฌ์ ๋๋ ๊ฒ์ด ๋ถํ์ํ๋ค๊ณ ์๊ฐํ๋ ์ด์ . ์ด์ฉ๋ฉด AGI ์ด์ ์ ๊ทธ๋ฐ ๊ฒ์ ๊ตฌ์ ๋๋ ๊ฒ์ ์๊ฐ ๋ญ๋น๋ผ๋ ๊ฒ์ด ์ข์ ํต์ฐฐ์ผ์ง๋.
6. ๋๋ ๊ตณ์ด ์คํ์์ค๋ก ๊ณต๊ฐํ๋ ๊ฒ์ ์ ํธํ์ง๋ ์๋๋ฐ, ์ด์ฐจํผ ์์ต ์ฐฝ์ถ์ด ์ค์ํ ๊ฒ์ด ์๋๋ผ๋ฉด ๊ณต๊ฐ๋ฅผ ํตํ ํ๋ณด ํจ๊ณผ๊ฐ ๊ฐ์น๊ฐ ๋ ํฐ ๊ฒ์ด ์๋๊น ํ๋ ์๊ฐ.
7. ๋ค๋ค MoE๋ฅผ ์ ๊ทธ๋ ๊ฒ ๋ฉ๋ฆฌํ์๊น ์ถ๊ธฐ๋. ๋ณ๋ก ์ฐ์ํ์ง ์๋ค๊ณ ์๊ฐํ๋์ง๋ ๋ชจ๋ฅด๊ฒ ์. (https://x.com/ArmenAgha/status/1883394504981659994) GPU๊ฐ ์๋๋ผ๋ GPU๋ฅผ ์๊ปด์ผ ํ๋ค๋ ๊ตํ.
8. ๊ทธ๋ฐ ์๋ฏธ์์ ๊ธฐ์กด ์ธํ๋ผ๋ ๋๊ตฌ์์ ํธํ์ฑ์ ์ํด ์ํคํ
์ฒ๋ฅผ ํ์ดํ๊ฒ ์ ์งํด์ผ ํ๋ค๋ ๊ฒ์ ๋ถํ์ํจ์ ํ์ธ. ์ฑ๋ฅ ์์์ ๊ทธ๊ฑด ์ค์ํ ์์๊ฐ ์๋๋ค. ๋ค๋ค ์ฑ๋ฅ์ด ์ข์ ๋ชจ๋ธ์ ์ฐ๊ณ ์ถ์ดํ๊ธฐ ๋ง๋ จ์ด๋ค. Qwen์ด๋ Mistral๋ MoE๋ฅผ ๋ ๋ฐ์ด๋ถ์ด์ง ์์ ๊ฒ์ ์ข ํํํ๊ณ ์์ง ์์๊น.
9. ํ๋์จ์ด๊ฐ ์๋ ์ํํธ์จ์ด์ ๊ธฐ์ ๊ฒฉ์ฐจ๋ ์๊ฐ๋ณด๋ค ๋๋ฌด๋ ๋น ๋ฅด๊ฒ ์ขํ์ง ์ ์๋ ๊ฒ ๊ฐ๋ค. ๊ธฐ๋ฐ์ ๋ถ์น๋๋ผ๋ ์์๊ฐ์ ๋ฐ๋ผ์ก์ ์ ์๋ค.
๊น์ฑํ๋
Box(ํ์ผ ๊ณต์ ยทํ์
SaaS)์ 2014๋
S-1(์์ฅ์ ๊ณ ์)๊ณผ ๋๊ท๋ชจ ์ ์ ์ฌ๋ก:
์ด์ฐฝ๊ธฐ SaaS ๊ธฐ์
๋ค์ โ๊ณ ๊ฐ ์์ ๊ฐ์น(LTV)๊ฐ ์ธ์
๋น์ฉ(CAC)๋ณด๋ค ํจ์ฌ ํฌ๋คโ๋ ๋
ผ๋ฆฌ๋ก ๋๊ท๋ชจ ๋ง์ผํ
ยท์์
๋น์ฉ ์ง์ถ โ ์ฅ๊ธฐ์ ์ผ๋ก ์ฌ๊ตฌ๋
(Recurring) ๋งค์ถ์ด ํ๋ณด๋๋ฉด ์ด์ต์ด ์ปค์ง๋ค.
์ด๋ก ์ธํด IPO ๋น์ โ์ฅ๊ธฐ ํฌ์ vs ๋จ๊ธฐ ์์คโ ๋
ผ์์ด ์์์ง๋ง, ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ง์ SaaS๊ฐ ์ ์ฌํ ๋ชจ๋ธ๋ก ์ฑ๊ณต.
ํ์๋ ์ด ํ์์ โ์ค๋ฆฌ์ฝ๋ฐธ๋ฆฌ 6๋ฒ์งธ ๊ฑฐ์ธ(Silicon Valley Inc.)โ์ด๋ผ ๋ถ๋ฆ(๋๋จธ์ง 5๋ ๊ฑฐ์ธ์ ์ ํ, ์๋ง์กด, ๊ตฌ๊ธ, ๋ฉํ, MS).
OpenAI o3 ๋ชจ๋ธ์ ๋ฑ์ฅ๊ณผ โInference-time Scalingโ
o1 ๋ชจ๋ธ(์ด์ ์ธ๋): ํ์ต ํ๋ผ๋ฏธํฐ ๊ท๋ชจ๊ฐ ํฌ๋ฉด ์ ํ๋๊ฐ ๋์์ง๋ค๋ โํ์ต ์ ์ค์ผ์ผ๋งโ๋ฟ ์๋๋ผ, โ์ถ๋ก ์ ๋ ๋ง์ ์ฐ์ฐ์ ํ ๋นํ๋ฉด ์ ํ๋๊ฐ ์ฌ๋ผ๊ฐ๋คโ๋ ํน์ฑ์ด ๋ฑ์ฅ.
o3 ๋ชจ๋ธ: o1๋ณด๋ค ํจ์ฌ ํฅ์๋ ๋ฒ์ . ํ์์ ๋ฐ๋ผ ๋ ๋ง์ GPU ์ฐ์ฐ(์ถ๋ก ์๊ฐ)์ ์์ผ๋ฉด ๋ฌธ์ ํด๊ฒฐ ์ ํ๋๊ฐ ํฌ๊ฒ ์์น(์: ARC ์๊ฐ ํผ์ฆํ
์คํธ์์ ์ธ๊ฐ ์์ค ์ ๊ทผ).
๋ค๋ง ํ์ฌ๋ ๋จ๊ฐ($17~20/ํ์คํฌ)๊ฐ ๋น์ธ์ง๋ง, ๋น ๋ฅธ ์๋๋ก ๋น์ฉ์ด ๋ด๋ ค๊ฐ ์ ๋ง.
์ด โ์ถ๋ก ์ ๋๊ท๋ชจ ์ฐ์ฐโ์ ๊ธฐ์กด ์คํ ๋ฆฌ๊ทธ๋ ์๋ธ(autoregressive) LLM๊ณผ ๋ฌ๋ฆฌ, ์ค์ค๋ก ์ฌ๋ฌ ๊ฐ์ง ๋ฐฉ์์ ํ์ยท๊ฒ์ฆ(โ์ฌ๋ฌ ์ฒด์ธ ์ค๋ธ ์ํธ๋ฅผ ์๋โ)ํ ์ ์๊ฒ ํจ โ ์ฌ๋์ด ์ง์ ๊ฒ์ํ์ง ์์๋ ์์
์ ์ด๋ ์ ๋ ์๊ฒฐ.
โAI Ammo(ํ์ฝ)โ vs โBarrel(์ด์ด)โ ๋น์
Keith Rabois๊ฐ ์คํ ํฌ๋ ๊ฐ์ฐ์์ ๋งํ โ์กฐ์ง์ ์๋๋ โ์ด์ด(Barrels)โ ์์ ๋ฌ๋ฆผ. ๋๋ถ๋ถ ์ธ์ฌ๋ โํ์ฝ(Ammunition)โ์ ๊ฐ๊น๋ค.โ
AI๊ฐ ๋ฐ์ ํ๋ฉด, **์๋ง์ โํ์ฝ(AI)โ**์ ์ ๋ ดํด์ง์ง๋ง, โ์ด์ด(Barrel)โ, ์ฆ ํ๋ก์ ํธ๋ฅผ ์ฒ์๋ถํฐ ๋๊น์ง ๋๊ณ ๊ฐ ์กฐ์ง์ ์ญ๋์ ์ฌ์ ํ ํฌ์.
AI๊ฐ ์ค์ค๋ก ์
๋ฌด๋ฅผ ์์(์ด์์คํดํธ ์๋ ๋
๋ฆฝํ์์)ํ๋ โ์ธ๋ ฅ ๋์ฒดโํ์ผ๋ก ์งํํ๋ ค๋ฉด, ๊ธฐ์
๊ตฌ์กฐยทํ๋ก์ธ์ค๋ ๊ฑฐ๊ธฐ์ ๋ง์ถฐ์ผ ํ์ง๋ง, ๊ธฐ์กด ๋๊ธฐ์
์ ๊ทธ๋ฐ ์ ํ์ด ์ฝ์ง ์์.
๋ถ๊ท ๋ฑํ(โUnevenโ) AI ๋์
OpenAI CEO Sam Altman์ 2025๋
์ ์ฒซ AI ์์ด์ ํธ๊ฐ ๊ธฐ์
์ฐ์ถ๋ฌผ์ ํฌ๊ฒ ๋ฐ๊ฟ ๊ฒ์ด๋ผ๊ณ ์ ๋งํ์ง๋ง,
ํ์๋ โ๊ธฐ์กด ๋๊ธฐ์
ยท์ ํต ๊ธฐ์
(CPG ๋ฑ)์ ์ ๋ฐ ์๋ํ ํ๋ก์ธ์ค๊ฐ ์ทจ์ฝ, ๋์
์ด ๋๋ฆด ๊ฒโ์ผ๋ก ๋ด.
SaaS๊ฐ ๊ธฐ์กด์ โ์๋ฆฌ๋ฅผ ์ก์ ๊ธฐ์
โ์ ์ํด โ์ฌ๋ ์ข์ ๋ผ์ด์ ์คโ๋ฅผ ํ๋ ๊ตฌ์กฐ์๋ ๊ฒ์ฒ๋ผ, AI ์๋์๋ โ๋ช
ํํ ํ์คํฌ์ ๋ํ ๊ฐ ์ง๋ถโ๋ก ์ ํ๋ ์๋ ์์.
ํ์ง๋ง ์ด๋ ์ฒ์๋ถํฐ AI ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ง ์ ์ ๊ธฐ์
์ด ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ์์ตํํ ๊ฐ๋ฅ์ฑ์ด ํผ(์: ๋์งํธ ๊ด๊ณ ์ด๊ธฐ์๋ P&G ๊ฐ์ ์ ํต์ฃผ์๋ณด๋ค ์ ๊ท D2C๊ธฐ์
์ด ๋จผ์ ์ฑ์ฅ).
๊ฒฐ๋ก : AI๋ ๊ณง ์ค์ง๋ง, ๊ธฐ์กด ๋๊ธฐ์
์ด ์ด๋ฅผ ํจ์จ์ ์ผ๋ก ํตํฉํ๊ธฐ๊น์ง๋ ์๊ฐ์ด ๊ฑธ๋ฆด ๊ฒ. ํฐ ์กฐ์ง์ ์คํ๋ ค ๋ฆ๊ณ , ์๋ก ์์ํ๋ ํ์ฌ์ผ์๋ก AI ์์ ์๋ํ๋ฅผ ๋น ๋ฅด๊ฒ ๊ตฌํํ ์ ๋ง.
https://stratechery.com/2025/ais-uneven-arrival/
โํฝ&์
๋ธ(picks-and-shovels)โ๋ก์์ Nvidia
์์ฑํ AI ๊ธ์ฑ์ฅ์ ์ต๋ ์ํ์๋ ํ์ฌ๋ Nvidia(GPU ๊ณต๊ธ์ฌ)์ฒ๋ผ ๋ณด์.
๋ง์ ๊ธฐ์
(Tesla, xAI, Azure, Google Cloud, AWS, Oracle ๋ฑ)์ ๋๊ท๋ชจ GPU๋ฅผ ์ฌ๋ค์ฌ ๊ฐ์ข
AI ๋ชจ๋ธ์ ์ค๋น ์ค. ํ์ง๋ง ๋น์ฅ์ ์์ต ํ์ ์ฌ๋ถ๋ ๋ถํฌ๋ช
.
Meta๊ฐ ๊ฐ์ฅ ํ์คํ โAI ๋น์ฉ โ ๊ด๊ณ ์์ตโ์ ์ฐ๊ฒฐ ์ง์ ์ ์์
Meta๋ ์ด๋ฏธ ์๋ํ๋ ๋จธ์ ๋ฌ๋ ๊ด๊ณ ์์คํ
(โ์ํ๋ ๊ฒฐ๊ณผ๋ง ์ ์ํ๋ฉด, ๋๋จธ์ง๋ ๋ธ๋๋ฐ์ค์ฒ๋ผ Meta๊ฐ ์์์ ์ต์ ํโ)์ ์ค๋์ ๋ถํฐ ๊ตฌ์ถ.
iOS ATT(App Tracking Transparency) ์ดํ, ํ์ฌ๋ ๋ ์ ๊ตํ ํ๊ฒํ
ยทํธ๋ํน์ด ์ด๋ ค์์ก์ง๋ง, Meta๋ ์์ฒญ๋ ๋ฐ์ดํฐ์ GPU ์ธํ๋ผ๋ก *โํ๋ฅ ์ ๊ด๊ณ ํ๊ฒํ
โ*์ ์ฌ๊ตฌ์ถ โ ๋ค๋ฅธ ๊ฒฝ์์ฌ๊ฐ ๋ฐ๋ผ์ค๊ธฐ ์ด๋ ค์ด ์์ค.
์ฌ๊ธฐ์ ์์ฑํ AI๋ฅผ ์ด์ฉํด ์๋ง์ ๊ด๊ณ ํฌ๋ฆฌ์์ดํฐ๋ธ๋ฅผ ์๋ ์์ฐยท์คํํ๋ฉด, ๊ด๊ณ ์ฃผ ์
์ฅ์์ โ์ด๋ป๊ฒ ๋ง๋ค์ด์ง๋์ง ๋ชฐ๋ผ๋, ๋งค์ถ์ด ์ฌ๋ผ๊ฐ๋ ์ธ ์๋ฐ์ ์๋โ ๊ตฌ์กฐ๊ฐ ํ์ฑ.
์ด๋ Meta๋ โ์ด๋ค ๊ด๊ณ ยทํ๊ฒํ
์ด ์๋๋์งโ๋ฅผ ์์ฒด์ ์ผ๋ก ์ถ์ , ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ถ ๋ฐ์ดํฐ๋ก ์ถ์ (๊ด๊ณ ์ฃผ์๊ฒ ๋ธ๋๋ฐ์ค).
๋น์ผ ๊ด๊ณ ๋จ๊ฐ๋ฅผ ๋ฐ๋๋ผ๋, ์ค์ ๋ก ํ๋งค์ฑ๊ณผ๊ฐ ์ข์ผ๋ฉด ๊ด๊ณ ์ฃผ๋ โ์ด ํ๋ซํผ์ด ์ ์ผ ๋ซ๋คโ๋ฉฐ ๊ณ์ ํฌ์.
Meta์ โ๊ธ๋ก๋ฒ ํผ๋โ ์ ํ๊ณผ AI ์ฝํ
์ธ
๋ณธ๋ ํ์ด์ค๋ถ์ ์น๊ตฌ/ํ๋ก์ฐ ๊ธฐ๋ฐ์ โ์์
๋คํธ์ํฌโ์ ์ฝ๋งค์ฌ ์์์ผ๋, ํฑํก ๊ฒฝ์ ๋ฑ์ ๊ณ๊ธฐ๋ก โ์ ์ ๋คํธ์ํฌ๋ฅผ ๋์ด์, ์ ์ธ๊ณ ๋ชจ๋ ์ฝํ
์ธ ๋ฅผ ๊ฐ์ธํํด ๋ณด์ฌ์ฃผ๋โ ๋ฐฉํฅ์ผ๋ก ๋ณ์ (Reels, ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐํ).
์ด์ ๊ทธ ๋ค์ ๋จ๊ณ๋ก, โ์ฌ์ฉ์๊ฐ ์ง์ ์ฌ๋ฆฐ UGC๋ฟ ์๋๋ผ, AI๊ฐ ์์ฑํ๋ ๋ง์ถคํ ์ด๋ฏธ์งยท์์์ ๋๊ท๋ชจ๋ก ํผ๋์ ๊ณต๊ธโํ ๊ฐ๋ฅ์ฑ.
์ด ๊ณผ์ ์์ ๊ธฐ์กด์๋ โ์ฌ์ฉ์ ์ฌ์งยท์์ โ ๊ด๊ณ โ ๊ตฌ์กฐ์๋ค๋ฉด, ์ด์ โAI๋ก ๋ง๋ ๋ชจ๋ ์ด๋ฏธ์งยท์์ ์์ฒด๊ฐ ๊ด๊ณ ๊ฐ ๋ ์๋ ์์.โ
์ฝํ
์ธ ์ ๊ด๊ณ ์ ๊ฒฝ๊ณ๊ฐ ํ๋ฆฟํด์ง๋ฉฐ, **์ํ๋ ์์ดํ
์ ์ฆ์ โํด๋ฆญโ๊ตฌ๋งคโ**ํ๋ ํํ๊ฐ ๊ฐ๋ฅํด์ง.
โ์ค๋ง์ผ ์ปค๋ธ(Smiling Curve)โ์ ๋ฌดํ ๊ด๊ณ ์ธ๋ฒคํ ๋ฆฌ
์ฝํ
์ธ ๊ฐ ๋ฌดํ์ ์์ฑ๋๋ฉด, ๊ด๊ณ ์ธ๋ฒคํ ๋ฆฌ(๋
ธ์ถ ์ง๋ฉด) ์ญ์ ์ด๋ก ์ ๋ฌดํ์ ๊ฐ๊น์์ง โ ๊ด๊ณ ๋จ๊ฐ๋ ์คํ๋ ค ๊ทน๋จ์ ์ผ๋ก ๋ฎ์์ง ์ ์์.
๊ทธ๋ฐ๋ฐ ๊ทธ ๋ฎ์ ๋จ๊ฐ์กฐ์ฐจ **์ด๋ํ ํ๋ซํผ(Meta)**๊ฐ ์ ์ฒด๋ฅผ ์ฅ์
ํ๋ฉด, ์๊ท๋ชจ ๊ฒฝ์์๋ค์ด ํ๊ณ ๋ค ํ์ด ๋์ฑ ์ค์ด๋ ๋ค.
Meta๊ฐ โ์ฌ์ฉ์์+AI ์ธํ๋ผ+๋ฐ์ดํฐโ๋ฅผ ๋ชจ๋ ๊ฐ์ถ ๊ฐ์ฅ ํฐ Aggregator๊ฐ ๋์ด, โ๋ฌดํ ์ฝํ
์ธ vs ๋ฌดํ ๊ด๊ณ โ๋ฅผ ์ฐ๊ฒฐํ๋ฉฐ ๋ง๋ํ ๊ฐ์น๋ฅผ ๋ง๋ค์ด๋ผ ๊ฒ.
์ฅ๊ธฐ ์ ๋ง: XR(๊ฐ์ยท์ฆ๊ฐํ์ค)๊ณผ โGenerative UIโ
4-1. XR์ AI๊ฐ ๊ฒฐํฉ๋์ด์ผ ํญ๋ฐ์ ์ผ๋ก ์๋ฏธ๊ฐ ์๊น
๋ฉํ๋ฒ์ค/VR/AR ๋ฑ์ ๋ง์ ์ด๋ค์ด ํ์์ ์ด์์ผ๋, AI๋ก ์ธํ โ3D์ฝํ
์ธ ์์ฑ ๋น์ฉโ ํ๊ธฐ์ ์ ๊ฐ์ด ๊ฐ๋ฅํด์ง๋ฉด, VR ๊ณต๊ฐ ์ค๊ณ๋ ํจ์ฌ ์ฌ์์ง(DALL-E๋ 3D ์์ฑ๋ชจ๋ธ ๋ฑ).
AR ๊ธฐ๊ธฐ(์: Meta๊ฐ ์ค๋นํ๋ Orion)์์๋, ์ค๋งํธํฐ ์์ ํฝ์
ํ๋ UI๋ ๋ถํธ. ๋์ AI๊ฐ โ์ฌ์ฉ์๊ฐ ํ์ํ ๋ ํ์ํ UI๋งโ ์ฆ์์์ ์์ฑํด์ค ์ ์์(Generative UI).
์ด๋ก์จ AR/VR ๊ธฐ๊ธฐ์ ํธ์์ฑ๊ณผ ๋ชฐ์
๊ฐ์ด ํฌ๊ฒ ๋ฐ์ด๋ ๊ฒ์ด๊ณ , ๊ทธ ํ๋ซํผ์ Meta๊ฐ ์ ๋.
4-2. ๊ฒฐ๋ก ์ ์ผ๋ก โํ์ค+๊ฐ์ ๋ชจ๋ ๋งฅ๋ฝ์ด ๊ด๊ณ ์ธ๋ฒคํ ๋ฆฌโ๊ฐ ๋จ
๋ฌผ๋ฆฌ ์ธ๊ณ๋ ๊ฐ์ ์ธ๊ณ๋ , AI๊ฐ ๋ชจ๋ ์ฌ๋ฌผ์ ์ธ์ํด, ๊ฑฐ๊ธฐ์ ๊ด๊ณ ๋ ํ๋งค ๋งํฌ๋ฅผ ์๋ ์ฐ๊ฒฐ(โ์ด ๊ณต๊ฐ์ด๋ ์ด ์ฌ๋ฌผ์ด๋ ๊ด๊ณ ๋ก์ ์ ํ ๊ฐ๋ฅโ).
AI ์๋์ โ๋ฌดํํ ํ์(Abundance to Infinity)โ์์ Meta๊ฐ ๊ฐ์ฅ ํฐ ์ํ์
https://stratechery.com/2024/metas-ai-abundance/
๋ฆฌ์ ์ฌํ: ํ์ดํ๋ผ์ด์ด๋ฅผ ํตํด ๊ธฐ์ ์ค์ฌ์ ํ์ ์ ๋ํ ์์ ๊ฐ์ด ๊ฐํ๋ ์ธก๋ฉด๋ ์์ง๋ง, ์ํํ ํญํด๋ง ์์๋ ๊ฒ์ ์๋๋๋ค. ์ฐ๋ฆฌ๋ ์ค๋ ์ถ์ ๊ณผ์ ์ ๊ฑฐ์ณค์ต๋๋ค. ์ธ๋ถ์์ ๋ณด๋ ํ์ดํ๋ผ์ด์ด์ ๋ชจ์ต์ 2015๋
์ดํ์ ๋ชจ์ต์ด์ง๋ง, ์ฌ์ค ์ ํฌ๋ 16๋
๋์ ํ์ดํ๋ผ์ด์ด๋ฅผ ์ด์ํด ์์ต๋๋ค.
๋ค์ ํ์ ์ด๋ผ๋ ์ฃผ์ ๋ก ๋์์์. ์ด์ ๊ฒฝ์ ๊ฐ ์ ํดํ๊ธฐ ์์ํ๊ณ ์๋ณธ์ด ๋ ์ด์ ์์ ์ฒ๋ผ ๋์จํด์ง์ง ์๋๋ฐ, ์ด๊ฒ์ด ๊ธฐ์ด ์ฐ๊ตฌ๋ฅผ ์ต์ ํ ๊น์?
๋์ํ: ๋ฐ๋์ ๊ทธ๋ ๊ฒ ์๊ฐํ์ง๋ ์์ต๋๋ค. ์ค๊ตญ์ ์ฐ์
๊ตฌ์กฐ ์กฐ์ ์ ํ์ฐ์ ์ผ๋ก ํ๋์ฝ์ด ๊ธฐ์ ํ์ ์ ๋ ๋ง์ด ์์กดํ๊ฒ ๋ ๊ฒ์
๋๋ค. ์ฌ๋๋ค์ด ๊ณผ๊ฑฐ์ ๋น ๋ฅด๊ฒ ๋์ ๋ฒ๋ ๊ฒ์ด ์ด์ด ์ข์์ ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๊นจ๋ซ๊ฒ ๋๋ฉด ์ค์ค๋ก๋ฅผ ๋ฎ์ถ๊ณ ์ง์ ํ ํ์ ์ ๋ ๊ธฐ๊บผ์ด ์ฐธ์ฌํ๊ฒ ๋ ๊ฒ์
๋๋ค.
๊ทธ๋์ ์ด๊ฒ๋ ๋๊ด์ ์ธ๊ฐ์?
๋ฆฌ์ ์ฌํ: ์ ๋ 1980๋
๋์ ๊ด๋ฅ์ฑ์ 5์ ๋์์์ ์๋์ต๋๋ค. ์๋ฒ์ง๋ ์ด๋ฑํ๊ต ๊ต์ฌ์์ต๋๋ค. 1990๋
๋์๋ ๊ด๋ฅ์ฑ์์ ๋์ ๋ฒ ์ ์๋ ๊ธฐํ๊ฐ ๋ง์์ต๋๋ค. ๋น์์๋ ๋ง์ ๋ถ๋ชจ๋์ด ์ ํฌ ์ง์ ์ค์
จ๋๋ฐ, ๊ธฐ๋ณธ์ ์ผ๋ก ๊ณต๋ถ๋ ์ธ๋ชจ์๋ค๊ณ ์๊ฐํ์
จ์ฃ . ํ์ง๋ง ์ง๊ธ ๋์ด์ผ๋ณด๋ฉด ๋ชจ๋ ์๊ฐ์ด ๋ฐ๋์์ต๋๋ค. ๋ ์ด์ ๋์ ๋ฒ๋ ๊ฒ์ด ์ฝ์ง ์๊ณ ํ์๋ฅผ ์ด์ ํ ๊ธฐํ์กฐ์ฐจ ๊ณง ์ฌ๋ผ์ง์ง๋ ๋ชจ๋ฅด๊ธฐ ๋๋ฌธ์
๋๋ค. ํ ์ธ๋๋ฐ์ ๊ฑธ๋ฆฌ์ง ์์์ต๋๋ค.
์์ผ๋ก๋ ํ๋์ฝ์ด ํ์ ์ด ์ ์ ๋ ๋ณดํธํ๋ ๊ฒ์
๋๋ค. ์ฌํ ์ ์ฒด๊ฐ ์ด ์ ์ ๋ํด ๊ต์ก์ ๋ฐ์์ผ ํ๊ธฐ ๋๋ฌธ์ ์ง๊ธ ๋น์ฅ ์ดํดํ๊ธฐ๋ ์ฝ์ง ์์ต๋๋ค. ์ฌํ๊ฐ ํ๋์ฝ์ด ํ์ ์ ์ ๋
ํ๋ ์ฌ๋๋ค์ด ๋ช
์ฑ๊ณผ ๋ถ๋ฅผ ์ป์ ์ ์๋๋ก ํ์ฉํ๋ฉด ์ฐ๋ฆฌ์ ์ง๋จ์ ์ฌ๊ณ ๋ฐฉ์๋ ์ ์ํ ๊ฒ์
๋๋ค. ๋ช ๊ฐ์ง ์์ ํ๋ก์ธ์ค๊ฐ ํ์ํฉ๋๋ค.
https://www.chinatalk.media/p/deepseek-ceo-interview-with-chinas
ํ์ง๋ง ๊ธฐ์ ์์ฒด๊ฐ ์ ๋ง ํฐ ๊ฒฉ์ฐจ๋ฅผ ๋ง๋ค ์ ์์๊น์? ๋ํ ์ ๋์ ์ธ ๊ธฐ์ ๋น๋ฐ์ ์๋ค๊ณ ๋ง์ํ์
จ์์์.
Liang Wenfeng: ๊ธฐ์ ์๋ ๋น๋ฐ์ด ์์ง๋ง ๋ณต์ ๋ฅผ ์ํด์๋ ์๊ฐ๊ณผ ๋น์ฉ์ด ํ์ํฉ๋๋ค. ์ด๋ก ์ ์ผ๋ก ์๋น๋์์ ๊ทธ๋ํฝ ์นด๋๋ ๊ธฐ์ ์ ๋น๋ฐ์ด ์๊ณ ๋ณต์ ํ๊ธฐ ์ฝ์ต๋๋ค. ํ์ง๋ง ์ฒ์๋ถํฐ ํ์ ๊ตฌ์ฑํ๊ณ ์ฐจ์ธ๋ ๊ธฐ์ ์ ๋ฐ๋ผ์ก๋ ๋ฐ๋ ์๊ฐ์ด ๊ฑธ๋ฆฌ๊ธฐ ๋๋ฌธ์ ์ค์ ํด์๋ ์๋นํ ๋์ต๋๋ค.
๋ค๋ฅธ 6๊ฐ ๋ํ ์คํํธ์
์ ์ต์ข
๊ฒ์์ ์ด๋ป๊ฒ ๋ ๊ฒ์ผ๋ก ๋ณด์๋์?
๋ฆฌ์ ์ฌํ: ๋์ธ ๊ฐ๋ ์ด์๋จ์ ์ ์์ต๋๋ค. ์ง๊ธ์ ๋ชจ๋ '๋ ๋ฒ๋' ๋จ๊ณ์ ์๊ธฐ ๋๋ฌธ์ ์๊ธฐ ํฌ์ง์
๋์ด ๋ช
ํํ๊ณ ์ด์์ ๋ ์ ๋ค๋ฌ๋ ํ์ฌ๊ฐ ์ด์๋จ์ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. ๋ค๋ฅธ ํ์ฌ๋ค์ ์๋นํ ๋ณํ๋ฅผ ๊ฒช์ ์๋ ์์ต๋๋ค. ๊ฐ์น ์๋ ๊ฒ๋ค์ด ๋จ์ํ ์ฌ๋ผ์ง๋ ๊ฒ์ด ์๋๋ผ ๋ค๋ฅธ ํํ๋ฅผ ๋ ๊ฒ ๋ ๊ฒ์
๋๋ค.
ํ์ดํ๋ผ์ด์ด์ ๊ฒฝ์์ ๋ํ ์ ๊ทผ ๋ฐฉ์์ ์ํ์ ๊ฒฝ์์ ๊ฑฐ์ ๊ด์ฌ์ ๊ธฐ์ธ์ด์ง ์๊ธฐ ๋๋ฌธ์ '๋ถํฌ๋ช
'ํ๋ค๊ณ ๋ฌ์ฌ๋์ด ์์ต๋๋ค. ๊ฒฝ์์ ๋ํด ์๊ฐํ ๋ ์ด๋ค ์ถ๋ฐ์ ์ด ์๋์?
๋ฆฌ์ ์ฌํ: ์ ๊ฐ ์์ฃผ ์๊ฐํ๋ ๊ฒ์ ์ด๋ค ๊ฒ์ด ์ฌํ ์ด์์ ํจ์จ์ฑ์ ํฅ์์ํฌ ์ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ์ฐ์
์ฒด์ธ ๋ด์์ ๊ฐ์ ์ ์ฐพ์ ์ ์๋์ง ์ฌ๋ถ์
๋๋ค. ๊ถ๊ทน์ ์ธ ๋ชฉํ๊ฐ ์ฌํ๋ฅผ ๋ ํจ์จ์ ์ผ๋ก ๋ง๋๋ ๊ฒ์ด๋ผ๋ฉด ๊ทธ ๋ชฉํ๋ ์ ํจํฉ๋๋ค. ๊ทธ ์ฌ์ด์ ๋ง์ ๊ฒ๋ค์ ์ผ์์ ์ธ ๋จ๊ณ์ ๋ถ๊ณผํ๋ฉฐ, ๊ทธ๊ฒ์ ์ง๋์น๊ฒ ์ง์คํ๋ฉด ํผ๋์ ์ด๋ํ ์ ์์ต๋๋ค.
OpenAI์ ์ ์ ์ฑ
์ฑ
์์์ด์ Anthropic์ ๊ณต๋ ์ฐฝ๋ฆฝ์์ธ ์ญ ํด๋ผํฌ๋ DeepSeek๊ฐ "์ดํดํ ์ ์๋ ๋ง๋ฒ์ฌ"๋ค์ ๊ณ ์ฉํ๋ค๊ณ ๋งํ์ต๋๋ค. ๋ฅ์์น V2์๋ ์ด๋ค ์ฌ๋๋ค์ด ์ฐธ์ฌํ๋์?
๋ฆฌ์ ์ฌํ: ๋ง๋ฒ์ฌ๋ ์์ต๋๋ค. ์ ํฌ๋ ๋๋ถ๋ถ ์ผ๋ฅ ๋ํ์ ๊ฐ ์กธ์
ํ ์ ์
์, 4~5๋
์ฐจ ๋ฐ์ฌ ๊ณผ์ ํ์, ๋ช ๋
์ ์ ์กธ์
ํ ์ ์์ด๋ค๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
๋ง์ LLM ํ์ฌ๊ฐ ํด์ธ ์ธ์ฌ ์ฑ์ฉ์ ์ง์ฐฉํ๊ณ ์์ผ๋ฉฐ, ์ด ๋ถ์ผ์ ์์ 50์๊ถ ์ธ์ฌ๋ ์ค๊ตญ ๊ธฐ์
์์ ์ผํ์ง ์์ ์๋ ์๋ค๋ ์๊ธฐ๋ ์ข
์ข
๋ค๋ฆฌ์ฃ . ํ์๋ค์ ์ถ์ ๊ตญ๊ฐ๋ ์ด๋์ธ๊ฐ์?
Liang Wenfeng: V2 ๋ชจ๋ธ์ ํ์ ์ค์๋ ํด์ธ์์ ์ค๊ตญ์ผ๋ก ๋์์จ ์ฌ๋์ ์์ผ๋ฉฐ ๋ชจ๋ ํ์ง์ธ์
๋๋ค. ์์ 50๋ช
์ ์ ๋ฌธ๊ฐ๊ฐ ์ค๊ตญ์ ์์ ์๋ ์์ง๋ง, ๊ทธ๋ฐ ์ธ์ฌ๋ ์ฐ๋ฆฌ๊ฐ ์ง์ ์์ฑํ ์๋ ์์ต๋๋ค.
์ด MLA ํ์ ์ ์ด๋ป๊ฒ ์์๋์๋์? ํ ์ ์ ์ฐ๊ตฌ์์ ๊ฐ์ธ์ ์ธ ๊ด์ฌ์์ ์์ด๋์ด๊ฐ ์์๋์๋ค๊ณ ๋ค์๋๋ฐ์?
๋ฆฌ์ ์ฌํ: ๊ทธ๋ ์ฃผ์ ์ง์ค ๋ฉ์ปค๋์ฆ์ ์ฃผ๋ฅ ์งํ ์ถ์ธ๋ฅผ ์์ฝํ ํ ๋์์ ์ค๊ณํด๋ณด๊ณ ์ถ๋ค๋ ์๊ฐ์ ํ์ต๋๋ค. ํ์ง๋ง ์์ด๋์ด๋ฅผ ํ์คํํ๋ ๋ฐ๋ ์ค๋ ์๊ฐ์ด ๊ฑธ๋ ธ์ต๋๋ค. ์ด๋ฅผ ์ํด ํน๋ณํ ํ์ ๊ตฌ์ฑํ๊ณ ๋ช ๋ฌ์ ๊ฑธ์ณ ์์
์ ์งํํ์ต๋๋ค. [์กฐ๋: ์๋ ๋๋ํฌ๋์ GPT ์๋ฆฌ์ฆ ์ด๊ธฐ ๊ธฐ๊ณ ๊ฐ ๋ ์ค๋ฅด๋ฉฐ, ๊ณผ๊ฑฐ ์ฐจ์ด๋ํก์์ ์๊ณ ๋ฆฌ์ฆ ํ์ ์ ๋ฐ๋์ฒด ์ ์กฐ์ ๊ฐ์ ๊ธฐ์ ๋ถ์ผ๋ฅผ ๊ฐ์ฒํ๋ ๊ฒ๊ณผ๋ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅด๋ค๊ณ ์ฃผ์ฅํ๋ ๋
ผ์ง๋ฅผ ๋ ์ฌ๋ฆฌ๊ฒ ํฉ๋๋ค. ๋ฐ์ฌ ํ์์ ์๋
๊ฐ์ ์
๊ณ ๊ฒฝํ์ด ์์ด์ผ๋ง ์ ์ฉํ ๊ฒ์ด ์๋๋ผ, ์ ๋ง ์๋ฆฌํ๊ณ ๊ตถ์ฃผ๋ฆฐ 20๋(์ค๊ตญ์๋ ๋ง์ 20๋๊ฐ ์์ต๋๋ค!)๊ฐ ๋๋ฉด ๊ทธ ๊ฒฝ๊ณ๋ฅผ ๋ํ ์ ์์ต๋๋ค. OpenAI์ ์ํ ๋๊ธ๋ผ์ค์ Anthropic์ ํธ๋ ํผ ๋ธ๋ฆฌ์ผ์ด ์งํํ ๋์๋ฅด์ผ์์์ ์ธํฐ๋ทฐ๋ ์ด๋ฌํ ์ญ๋์ฑ์ ์ ๋ณด์ฌ์ค๋๋ค. "์ธ๊ตํ ๋
ผ๋ฌธ์ ์ด ๋
ธ์ ๋ธ๋ผ์ด์ ์ํ ์ ๋ํด ์ด๋ ๊ฒ ๋งํ์ต๋๋ค: "๊ทธ๋ ์ด ๋ถ์ผ์ ์ข
์ฌํ ์ง 1.5๋
๋ฐ์ ๋์ง ์์์ง๋ง, AI ์
๊ณ ์ฌ๋๋ค์ ๊ทธ๊ฐ ์ ๋ฏธ๋์ ์ฑ๊ณต์ ๊ฐ์ฅ ์ค์ํ ์ธ๋ฌผ ์ค ํ ๋ช
์ด๋ผ๋ ๊ฒ์ ์๊ณ ์์ต๋๋ค."]๋ก ์์ํ๋ ๋์๋ฅด์ผ์.
์ด๋ฌํ ๋ค์ํ ์ฌ๊ณ ์ ์ถํ์ ํ์ ์ค์ฌ์ ์กฐ์ง ๊ตฌ์กฐ์ ๋ฐ์ ํ ๊ด๋ จ์ด ์๋ ๊ฒ์ผ๋ก ๋ณด์
๋๋ค. ํ์ดํ๋ผ์ด์ด ์๋์๋ ํ์์ ๋ชฉํ๋ ๊ณผ์ ๋ฅผ ์์์ ์๋๋ก ํ ๋นํ๋ ๊ฒฝ์ฐ๊ฐ ๊ฑฐ์ ์์์ต๋๋ค. ํ์ง๋ง AGI๋ ๋ถํ์ค์ฑ์ด ํฐ ๊ฐ์ฒ์ง ํํ์ ํฌํจํ๋๋ฐ, ์ด๋ก ์ธํด ๊ฒฝ์์ง์ ๊ฐ์
์ด ๋ ๋ง์์ก๋์?
Liang Wenfeng: DeepSeek๋ ์ฌ์ ํ ์ ์ ์ผ๋ก ์ํฅ์์
๋๋ค. ์ฐ๋ฆฌ๋ ์ผ๋ฐ์ ์ผ๋ก ์ญํ ์ ๋ฏธ๋ฆฌ ์ ์ํ์ง ์๊ณ ์์ฐ์ค๋ฝ๊ฒ ๋ถ์
์ด ์ด๋ฃจ์ด์ง๋๋ค. ๋ชจ๋๊ฐ ๊ฐ์์ ๊ณ ์ ํ ์ฌ์ ์ ๊ฐ์ง๊ณ ์๊ณ ์์ด๋์ด๋ฅผ ๊ฐ์ ธ์ค๊ธฐ ๋๋ฌธ์ ๋๊ตฌ๋ฅผ ๋ฐ์ด๋ถ์ผ ํ์๊ฐ ์์ต๋๋ค. ํ๊ตฌํ๋ ๋์ ๋๊ตฐ๊ฐ๊ฐ ๋ฌธ์ ๋ฅผ ๋ฐ๊ฒฌํ๋ฉด ์์ฐ์ค๋ฝ๊ฒ ๋ค๋ฅธ ์ฌ๋๊ณผ ๋
ผ์ํ๊ฒ ๋ฉ๋๋ค. ํ์ง๋ง ์ด๋ค ์์ด๋์ด๊ฐ ์ ์ฌ๋ ฅ์ ๋ณด์ด๋ฉด ํํฅ์์ผ๋ก ๋ฆฌ์์ค๋ฅผ ํ ๋นํฉ๋๋ค.
DeepSeek๋ GPU์ ์ธ๋ ฅ๊ณผ ๊ฐ์ ๋ฆฌ์์ค๋ฅผ ๋งค์ฐ ์ ์ฐํ๊ฒ ๋์ํ๋ค๊ณ ๋ค์์ต๋๋ค.
Liang Wenfeng: ํ์ ๋๊ตฌ๋ ์ธ์ ๋ ์ง GPU๋ ์ธ๋ ฅ์ ์ด์ฉํ ์ ์์ต๋๋ค. ์์ด๋์ด๊ฐ ์๋ ์ฌ๋์ ์น์ธ ์์ด๋ ์ธ์ ๋ ์ง ํธ๋ ์ด๋ ํด๋ฌ์คํฐ ์นด๋์ ์ก์ธ์คํ ์ ์์ต๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, ๊ณ์ธต ๊ตฌ์กฐ๋ ๋ณ๋์ ๋ถ์๊ฐ ์๊ธฐ ๋๋ฌธ์ ์๋ก ๊ด์ฌ๋ง ์๋ค๋ฉด ํ์๋ค ๊ฐ์ ํ์
ํ ์ ์์ต๋๋ค.
์ด๋ฌํ ๋์จํ ๊ฒฝ์ ์คํ์ผ์ ์๊ธฐ ์ฃผ๋์ฑ์ด ๋์ ์ธ์ฌ๋ฅผ ํ๋ณดํ๋ ๋ฐ ์์กดํฉ๋๋ค. ๊ธฐ์กด๊ณผ๋ ๋ค๋ฅธ ํ๊ฐ ๊ธฐ์ค์ ํตํด ๋ฐ์ด๋ ์ธ์ฌ๋ฅผ ๋ฐ๊ตดํ๋ ๋ฐ ํ์ํ๋ค๊ณ ๋ค์์ต๋๋ค.
Liang Wenfeng: ์ ํฌ์ ์ฑ์ฉ ๊ธฐ์ค์ ํญ์ ์ด์ ๊ณผ ํธ๊ธฐ์ฌ์
๋๋ค. ์ฐ๋ฆฌ ํ์ ์ค ์๋น์๊ฐ ํน์ดํ ๊ฒฝํ์ ๊ฐ์ง๊ณ ์๊ณ , ์ด๋ ๋งค์ฐ ํฅ๋ฏธ๋กญ์ต๋๋ค. ๊ทธ๋ค์ ์ข
์ข
๋์ ๋ฒ๊ธฐ ์ ์ ์ฐ๊ตฌ๋ฅผ ํ๊ณ ์ ํ๋ ์ด๋ง์ ๊ฐ์ง๊ณ ์์ต๋๋ค.
ํธ๋์คํฌ๋จธ๋ ๊ตฌ๊ธ์ AI ๋ฉ์์, ChatGPT๋ OpenAI์์ ํ์ํ์ต๋๋ค. ๋๊ธฐ์
์ AI ์ฐ๊ตฌ์์ ์คํํธ์
์ ํ์ ์ ๊ฐ์น๋ฅผ ์ด๋ป๊ฒ ๋น๊ตํ์๋์?
Liang Wenfeng: Google์ AI Lab, OpenAI, ์ฌ์ง์ด ์ค๊ตญ ๊ธฐ์ ๊ธฐ์
์ AI ์ฐ๊ตฌ์๋ ๋ชจ๋ ์์ฒญ๋ ๊ฐ์น๋ฅผ ์ง๋๊ณ ์์ต๋๋ค. OpenAI๊ฐ ์ฑ๊ณตํ ์ ์์๋ ๊ฒ์ ๋ถ๋ถ์ ์ผ๋ก๋ ๋ช ๊ฐ์ง ์ญ์ฌ์ ์ฐ์ฐ์ด ์์๊ธฐ ๋๋ฌธ์
๋๋ค.
๊ทธ๋ ๋ค๋ฉด ํ์ ์ ์ฃผ๋ก ์ด์ ๋ฌธ์ ์ธ๊ฐ์? ์ฌ๋ฌด์ค์ ํ์์ค ๊ฐ์ด๋ฐ ์ค์ ์์ชฝ์ ๋๊ตฌ๋ ์ด ์ ์๋ ๋ฌธ์ด ์๋ ๊ฒ์ ๋ณด์์ต๋๋ค. ๋๋ฃ๋ค์ ์ด ๋์์ธ์ด ์ฐ์ฐ์ ์ฌ์ง๋ฅผ ๋จ๊ฒจ๋๋ค๊ณ ๋งํ๋๊ตฐ์. ํธ๋์คํฌ๋จธ์ ํ์์๋ ๋๊ตฐ๊ฐ๊ฐ ํ ๋ก ์ ์ฐ์ฐํ ๋ฃ๊ณ ์ฐธ์ฌํ์ฌ ๊ถ๊ทน์ ์ผ๋ก ์ผ๋ฐ์ ์ธ ํ๋ ์์ํฌ๋ก ์ ํํ๋ ๊ณผ์ ์ด ํฌํจ๋์์ต๋๋ค.
๋ฆฌ์ ์ฌํ: ํ์ ์ ๋ฏฟ์์์ ์์๋๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ค๋ฆฌ์ฝ๋ฐธ๋ฆฌ๊ฐ ํ์ ์ ์ธ ์ด์ ๋ ๋ฌด์์ผ๊น์? ๊ณผ๊ฐํ๊ฒ ๋์ ํ๊ธฐ ๋๋ฌธ์ด์ฃ . ChatGPT๊ฐ ๋์์ ๋ ์ค๊ตญ์ ๊ธฐ์ ์ปค๋ฎค๋ํฐ๋ ํ๋ก ํฐ์ด ํ์ ์ ๋ํ ์์ ๊ฐ์ด ๋ถ์กฑํ์ต๋๋ค. ํฌ์์๋ถํฐ ๋๊ธฐ์
๊น์ง ๋ชจ๋ ๊ฒฉ์ฐจ๊ฐ ๋๋ฌด ํฌ๋ค๊ณ ์๊ฐํ๊ณ ์ ํ๋ฆฌ์ผ์ด์
์ ์ง์คํ๊ธฐ๋ก ํ์ต๋๋ค. ํ์ง๋ง ํ์ ์ ์์ ๊ฐ์์ ์์๋๋ฉฐ, ์ฐ๋ฆฌ๋ ์ข
์ข
์ ์์ด๋ค์๊ฒ์ ๋ ๋ง์ด ๋ณผ ์ ์์ต๋๋ค.
ํ์ง๋ง ํ๋๋ ์ด์ง์ด๋ ๋์ค๊ณผ์ ์ํต์ ํ์ง ์์ผ์
์ ์ ๊ทน์ ์ผ๋ก ํ๋๋ ์ด์ง์ ํ๋ ํ์ฌ๋ค์ ๋นํด ์ธ์ง๋๊ฐ ๋ฎ์ ๊ฒ ๊ฐ๋ค์. ์ด๋ป๊ฒ ํ๋ฉด ๋ฅ์ํฌ๊ฐ LLM ๊ด๋ จ ์ข
์ฌ์๋ค์๊ฒ ์ต๊ณ ์ ์ ํ์ผ๋ก ๋จ์ ์ ์์๊น์?
Liang Wenfeng: ๊ฐ์ฅ ์ด๋ ค์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์๊ธฐ ๋๋ฌธ์
๋๋ค. ์ต๊ณ ์ ์ธ์ฌ๋ค์ ์ธ๊ณ์์ ๊ฐ์ฅ ์ด๋ ค์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ๊ฐ์ฅ ํฐ ๋งค๋ ฅ์ ๋๋๋๋ค. ์ฌ์ค ์ค๊ตญ์ ์ต๊ณ ์ธ์ฌ๋ค์ ์ฌํ์ ์ผ๋ก ํ๋์ฝ์ดํ ํ์ ์ด ๊ฑฐ์ ์ด๋ฃจ์ด์ง์ง ์์ ์ธ์ ๋ฐ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ ๊ณผ์ํ๊ฐ๋๊ณ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ฐ์ฅ ์ด๋ ค์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์์ผ๋ฉฐ, ์ด๋ ๋ณธ์ง์ ์ผ๋ก ๊ทธ๋ค์๊ฒ ๋งค๋ ฅ์ ์
๋๋ค.
๋ํ ๋ชจ๋ธ์ ์ต์ข
๋ชฉํ๋ ๋ฌด์์ด๋ผ๊ณ ์๊ฐํ์๋์?
๋ฆฌ์ ์ฌํ: ๊ณต๊ธ๋ง์ ๋ชจ๋ ๋
ธ๋์์ ๊ด๋ฒ์ํ ์ ๋ฌธํ๋ฅผ ๋ฌ์ฑํ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ์ ๋ฌธ ๊ธฐ์
์ด ๋ฑ์ฅํ ๊ฒ์
๋๋ค. ๋ ๋ง์ ์ฌ๋๋ค์ด ์ด ๋ชจ๋ ๊ฒ์ ๊ธฐ๋ฐ์ผ๋ก ์ฌํ์ ๋ค์ํ ์๊ตฌ๋ฅผ ์ถฉ์กฑ์ํฌ ๊ฒ์
๋๋ค.
๋ค๋ฅธ ๋ํ ๋ชจ๋ธ ์คํํธ์
๋ค์ [๊ธฐ์ ๊ณผ ์์ฉํ]๋ฅผ ๋ชจ๋ ์ถ๊ตฌํ๋ค๊ณ ์ฃผ์ฅํ์ง๋ง, ๊ฒฐ๊ตญ ๊ธฐ์ ์ฐ์๋ฅผ ์ ํ์ผ๋ก ์ ํํ ์ ์๋ ๊ธฐํ์ ์ฐฝ์ ํ์ฉํ๋ ๊ฒ๋ ์ค์ํ๊ธฐ ๋๋ฌธ์ ๊ธฐ์ ์ด ์๊ตฌ์ ์ธ ๋ฆฌ๋์ญ์ ๊ฐ์ ธ๋ค์ฃผ์ง๋ ์์ ๊ฒ์
๋๋ค. ๋ฅ์ํฌ์ ๋ชจ๋ธ ์ญ๋์ด ์์ง ์ถฉ๋ถํ์ง ์๊ธฐ ๋๋ฌธ์ ๊ณผ๊ฐํ๊ฒ ๋ชจ๋ธ ์ฐ๊ตฌ์ ์ง์คํ๋ ๊ฑด๊ฐ์?
๋ฆฌ์ ์ฌํ: ์ด๋ฌํ ๋น์ฆ๋์ค ํจํด์ ๋ชจ๋ ์ด์ ์ธ๋์ ์ฐ๋ฌผ์ด๋ฉฐ ๋ฏธ๋์๋ ํตํ์ง ์์ ์๋ ์์ต๋๋ค. ์ธํฐ๋ท ๋น์ฆ๋์ค ๋
ผ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฏธ๋์ AI ์์ต ๋ชจ๋ธ์ ๋
ผ์ํ๋ ๊ฒ์ ๋ง์น ํฌ๋ ๋ง๊ฐ ์ฌ์
์ ์์ํ ๋ ์ ๋๋ด ์ผ๋ ํธ๋ฆญ๊ณผ ์ฝ์นด์ฝ๋ผ์ ๋ํด ๋
ผ์ํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ๋ฌด์๋ฏธํ ๋
ผ์(ๅป่ๆฑๅ)์
๋๋ค.
๊ณผ๊ฑฐ ํ์ดํ๋ผ์ด์ด ํํธ ํ๋๋ ๊ธฐ์ ๊ณผ ํ์ ์ ํํํ ๊ธฐ๋ฐ์ ๊ฐ์ง๊ณ ์์๊ณ ์ฑ์ฅ๋ ๋น๊ต์ ์์กฐ๋ก์ ์ต๋๋ค. ์ด๊ฒ์ด ๋๊ด์ ์ธ ์ด์ ์ธ๊ฐ์?
๊ทธ ์ ์๋ ๋๋ถ๋ถ์ ์ค๊ตญ ๊ธฐ์
์ด ์ ํ๋ฆฌ์ผ์ด์
์ ์ํด ํ ์ธ๋์ ๋ผ๋ง ์ํคํ
์ฒ๋ฅผ ์ง์ ๋ณต์ฌํ์ต๋๋ค. ๋ชจ๋ธ ๊ตฌ์กฐ์์ ์์ํ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
Liang Wenfeng: ์ ํ๋ฆฌ์ผ์ด์
์ ๋ง๋๋ ๊ฒ์ด ๋ชฉํ๋ผ๋ฉด ๋น ๋ฅธ ์ ํ ๋ฐฐํฌ๋ฅผ ์ํด ๋ผ๋ง ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ํฉ๋ฆฌ์ ์
๋๋ค. ํ์ง๋ง ์ฐ๋ฆฌ์ ๋ชฉํ๋ AGI์ด๋ฏ๋ก ์ ํ๋ ๋ฆฌ์์ค๋ก ๋ ๊ฐ๋ ฅํ ๋ชจ๋ธ ๊ธฐ๋ฅ์ ๊ตฌํํ๊ธฐ ์ํด ์๋ก์ด ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ฐ๊ตฌํด์ผ ํฉ๋๋ค. ์ด๋ ๋ ํฐ ๋ชจ๋ธ๋ก ํ์ฅํ๊ธฐ ์ํด ํ์ํ ๊ธฐ๋ณธ์ ์ธ ์ฐ๊ตฌ ๋ถ์ผ ์ค ํ๋์
๋๋ค. ๋ํ ๋ชจ๋ธ ๊ตฌ์กฐ ์ธ์๋ ๋ฐ์ดํฐ ๊ตฌ์ฑ๊ณผ ๋ชจ๋ธ์ ๋ณด๋ค ์ธ๊ฐ๊ณผ ์ ์ฌํ๊ฒ ๋ง๋๋ ๋ฑ ๋ค๋ฅธ ์์ญ์์๋ ๊ด๋ฒ์ํ ์ฐ๊ตฌ๋ฅผ ์ํํ์ผ๋ฉฐ, ์ด๋ ๋ชจ๋ ์ด๋ฒ์ ์ถ์ํ ๋ชจ๋ธ์ ๋ฐ์๋์์ต๋๋ค. ๋ํ, ํ์ต ํจ์จ์ฑ๊ณผ ์ถ๋ก ๋น์ฉ ์ธก๋ฉด์์ ๋ผ๋ง์ ๊ตฌ์กฐ๋ ํ์ต ํจ์จ์ฑ๊ณผ ์ถ๋ก ๋น์ฉ์ ์์ด ๊ตญ์ ์ ์ธ ํ๋ก ํฐ์ด ์์ค๊ณผ 2์ธ๋ ๊ฒฉ์ฐจ๊ฐ ์๋ ๊ฒ์ผ๋ก ํ๊ฐ๋๊ณ ์์ต๋๋ค.
์ด๋ฌํ ์ธ๋ ์ฐจ์ด๋ ์ฃผ๋ก ์ด๋์์ ๋ฐ์ํ๋์?
๋ฆฌ์ ์ฌํ: ์ฐ์ ํ๋ จ ํจ์จ์ฑ์ ๊ฒฉ์ฐจ๊ฐ ์์ต๋๋ค. ๊ตญ์ ์ต๊ณ ์์ค๊ณผ ๋น๊ตํ์ ๋ ์ค๊ตญ์ ์ต๊ณ ์ญ๋์ ๋ชจ๋ธ ๊ตฌ์กฐ์ ํ๋ จ ์ญํ์์ ๋ ๋ฐฐ์ ๊ฒฉ์ฐจ๊ฐ ์์ ๊ฒ์ผ๋ก ์ถ์ ๋๋๋ฐ, ์ด๋ ๋์ผํ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด ๋ ๋ฐฐ์ ์ปดํจํ
ํ์๋ฅผ ์๋นํด์ผ ํ๋ค๋ ์๋ฏธ์
๋๋ค. ๋ํ ๋ฐ์ดํฐ ํจ์จ์ฑ์์๋ 2๋ฐฐ์ ๊ฒฉ์ฐจ๊ฐ ์์ ์ ์์ต๋๋ค. ์ฆ, ๋์ผํ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด ๋ ๋ฐฐ์ ํ์ต ๋ฐ์ดํฐ์ ์ปดํจํ
ํ์๋ฅผ ์๋นํด์ผ ํฉ๋๋ค. ์ด๋ฅผ ๋ชจ๋ ํฉ์น๋ฉด ์ปดํจํ
์ฑ๋ฅ์ด 4๋ฐฐ ๋ ํ์ํฉ๋๋ค. ์ฐ๋ฆฌ๊ฐ ํ๊ณ ์ ํ๋ ๊ฒ์ ์ด๋ฌํ ๊ฒฉ์ฐจ๋ฅผ ๊ณ์ ์ขํ๋ ๊ฒ์
๋๋ค.
๋๋ถ๋ถ์ ์ค๊ตญ ๊ธฐ์
๋ค์ ๋ชจ๋ธ๊ณผ ์ ํ๋ฆฌ์ผ์ด์
์ ๋ชจ๋ ๊ฐ์ถ๊ณ ์์ต๋๋ค. ๋ฅ์ํฌ๋ ์ ์ฐ๊ตฌ์ ํ์์๋ง ์ง์คํ๊ธฐ๋ก ๊ฒฐ์ ํ๋์?
Liang Wenfeng: ์ง๊ธ ๊ฐ์ฅ ์ค์ํ ๊ฒ์ ๊ธ๋ก๋ฒ ํ์ ์ ๋ฌผ๊ฒฐ์ ๋์ฐธํ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ๊ธฐ ๋๋ฌธ์
๋๋ค. ์๋
๋์ ์ค๊ตญ ๊ธฐ์
๋ค์ ๋ค๋ฅธ ๊ธฐ์
๋ค์ด ๊ธฐ์ ํ์ ์ ํ๋ ๋ฐ ์ต์ํด์ก๊ณ , ์ฐ๋ฆฌ๋ ์ ํ๋ฆฌ์ผ์ด์
์์ตํ์ ์ง์คํ์ง๋ง ์ด๋ ํผํ ์ ์๋ ํ๋ฆ์
๋๋ค. ์ด ๋ฌผ๊ฒฐ ์์์ ์ฐ๋ฆฌ์ ์ถ๋ฐ์ ์ ๋จ๊ธฐ๊ฐ์ ์์ต์ ์ฐฝ์ถํ ์ ์๋ ๊ธฐํ๋ฅผ ํ์ฉํ๋ ๊ฒ์ด ์๋๋ผ ๊ธฐ์ ์ ํ๊ณ์ ๋๋ฌํ๊ณ ์ ์ฒด ์ํ๊ณ์ ๋ฐ์ ์ ์ฃผ๋ํ๋ ๊ฒ์
๋๋ค.
์ธํฐ๋ท๊ณผ ๋ชจ๋ฐ์ผ ์ธํฐ๋ท ์๋๋ฅผ ๊ฑฐ์น๋ฉด์ ๋๋ถ๋ถ์ ์ฌ๋๋ค์ ๋ฏธ๊ตญ์ด ๊ธฐ์ ํ์ ์ ๋ฐ์ด๋๊ณ ์ค๊ตญ์ ์ ํ๋ฆฌ์ผ์ด์
์ ์์ ๋ฐ์ด๋๋ค๋ ๋ฏฟ์์ ๊ฐ๊ฒ ๋์์ต๋๋ค.
๋ฆฌ์ ์ฌํ: ์ฐ๋ฆฌ๋ ๊ฒฝ์ ๊ฐ ๋ฐ์ ํจ์ ๋ฐ๋ผ ์ค๊ตญ์ด ๋ฌด์์น์ฐจํ๋ ๋์ ์ ์ฐจ ๊ธฐ์ฌํ๋ ๊ตญ๊ฐ๊ฐ ๋์ด์ผ ํ๋ค๊ณ ๋ฏฟ์ต๋๋ค. ์ง๋ 30๋
์ด์์ IT ๋ฌผ๊ฒฐ ์์์ ์ฐ๋ฆฌ๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ง์ ํ ๊ธฐ์ ํ์ ์ ์ฐธ์ฌํ์ง ์์์ต๋๋ค. ์ฐ๋ฆฌ๋ ๋ฌด์ด์ ๋ฒ์น์ด ํ๋์์ ๋จ์ด์ง๊ณ ๋ ๋์ ํ๋์จ์ด์ ์ํํธ์จ์ด๊ฐ ๋ฑ์ฅํ ๋๊น์ง 18๊ฐ์ ๋์ ์ง์ ๋์ ๊ธฐ๋ค๋ฆฌ๋ ๋ฐ ์ต์ํด์ ธ ์์ต๋๋ค. ์ค์ผ์ผ๋ง ๋ฒ์น์ด ๊ทธ๋ฐ ์์ผ๋ก ์ทจ๊ธ๋๊ณ ์์ต๋๋ค.
ํ์ง๋ง ์ฌ์ค ์ด๊ฒ์ ์๊ตฌ ์ฃผ๋์ ์ฌ๋ฌ ์ธ๋์ ๊ฑธ์น ๊ธฐ์ ์ปค๋ฎค๋ํฐ์ ๋์์๋ ๋
ธ๋ ฅ์ ํตํด ๋ง๋ค์ด์ง ๋ฒ์น์
๋๋ค. ๋จ์ง ์ฐ๋ฆฌ๊ฐ ์ด ๊ณผ์ ์ ์ฐธ์ฌํ์ง ์์๋ค๋ ์ด์ ๋ก ๊ทธ ์กด์ฌ๋ฅผ ๋ฌด์ํด ์์ ๋ฟ์
๋๋ค.
DeepSeek V2๊ฐ ์ค๋ฆฌ์ฝ ๋ฐธ๋ฆฌ์ ๋ง์ ์ฌ๋๋ค์ ๋๋ผ๊ฒ ํ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
Liang Wenfeng: ๋ฏธ๊ตญ์์ ๋งค์ผ ์ผ์ด๋๋ ์๋ง์ ํ์ ์ค์์ ์ด๊ฒ์ ๋งค์ฐ ํ๋ฒํ ์ผ์
๋๋ค. ์ค๊ตญ ๊ธฐ์
์ด ํ์ ์ ๊ธฐ์ฌํ๋ ๊ธฐ์
์ผ๋ก ์ฐธ์ฌํ๊ธฐ ๋๋ฌธ์ ๋๋๋ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฒฐ๊ตญ ๋๋ถ๋ถ์ ์ค๊ตญ ๊ธฐ์
์ ํ์ ์ด ์๋ ์ถ์ข
์ ์ต์ํ๊ธฐ ๋๋ฌธ์
๋๋ค.
ํ์ง๋ง ์ค๊ตญ ์ํฉ์์ ํ์ ์ ์ ํํ๋ ๊ฒ์ ๋งค์ฐ ์ฌ์น์ค๋ฌ์ด ๊ฒฐ์ ์
๋๋ค. ๋ํ ๋ชจ๋ธ์ ๋ง๋ํ ํฌ์๊ฐ ํ์ํ ๊ฒ์์ด๋ฉฐ, ๋ชจ๋ ๊ธฐ์
์ด ์์ฉํ๋ฅผ ๋จผ์ ์๊ฐํ์ง ์๊ณ ์ฐ๊ตฌ์ ํ์ ์๋ง ์ง์คํ ์ ์๋ ์๋ณธ์ ๊ฐ์ง๊ณ ์๋ ๊ฒ์ ์๋๋๋ค.
๋ฆฌ์ ์ฌํ: ํ์ ๋น์ฉ์ด ๊ฒฐ์ฝ ๋ฎ์ง ์์ผ๋ฉฐ, ๋ฌด๋ถ๋ณํ ์ฐจ์
์ ๋ํ ๊ณผ๊ฑฐ์ ๊ฒฝํฅ๋ ์ค๊ตญ์ ์ด์ ์ํฉ๊ณผ ๊ด๋ จ์ด ์์ต๋๋ค. ํ์ง๋ง ์ง๊ธ์ ์ค๊ตญ์ ๊ฒฝ์ ๊ท๋ชจ๋ ๋ฐ์ดํธ๋์ค, ํ
์ผํธ์ ๊ฐ์ ๊ฑฐ๋ ๊ธฐ์
์ ์ด์ต ๋ฑ ๊ธ๋ก๋ฒ ๊ธฐ์ค์ผ๋ก ๋ณผ ๋ ์ด๋ ๊ฒ ํ๋ ๋ฎ์ ๊ฒ์ด ์์ต๋๋ค. ์ฐ๋ฆฌ์๊ฒ ํ์ ์์ ๋ถ์กฑํ ๊ฒ์ ์๋ณธ์ด ์๋๋ผ ํจ๊ณผ์ ์ธ ํ์ ์ ์ํด ๊ณ ๋ฐ๋ ์ธ์ฌ๋ฅผ ์กฐ์งํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์์ ๊ฐ๊ณผ ์ง์์ด ๋ถ์กฑํ๋ค๋ ๊ฒ์
๋๋ค.
๊ฑฐ๋ ๊ธฐ์ ๋๊ธฐ์
์ ํฌํจํ ์ค๊ตญ ๊ธฐ์
๋ค์ด ๋น ๋ฅธ ์์ฉํ๋ฅผ ์ต์ฐ์ ์์๋ก ์ผ๋ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
๋ฆฌ์ ์ฌํ: ์ง๋ 30๋
๋์ ์ฐ๋ฆฌ๋ ํ์ ์ ์ํํ ํ ์ฑ ์์ต ์ฐฝ์ถ๋ง์ ๊ฐ์กฐํด ์์ต๋๋ค. ํ์ ์ ์ ์ ์ผ๋ก ๋น์ฆ๋์ค ์ค์ฌ์ด ์๋๋ผ ํธ๊ธฐ์ฌ๊ณผ ์ฐฝ์กฐ์ ๋ํ ์ด๋ง๋ ํ์ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ค๋๋ ์ต๊ด์ ์ ์ฝ์ ๋ฐ์์ ๋ฟ์ธ๋ฐ, ์ด๋ ํน์ ๊ฒฝ์ ๊ตญ๋ฉด๊ณผ ๊ด๋ จ์ด ์์ต๋๋ค.
ํ์ง๋ง ๊ท์ฌ๋ ๊ถ๊ทน์ ์ผ๋ก ๊ณต์ต ์ฐ๊ตฌ ๊ธฐ๊ด์ด ์๋๋ผ ๋น์ฆ๋์ค ์กฐ์ง์ธ๋ฐ, ํ์ ์ ์ ํํ๊ณ ๊ทธ ํ์ ์ ์คํ์์คํํ ๋ ํด์๋ฅผ ์ด๋์ ๊ตฌ์ถํ ๊น์? 5์์ ๊ณต๊ฐํ MLA ์ํคํ
์ฒ๋ ๋ค๋ฅธ ์ฌ๋๋ค์ด ๋น ๋ฅด๊ฒ ๋ชจ๋ฐฉํ์ง ์์๊น์?
Liang Wenfeng: ํ๊ดด์ ์ธ ๊ธฐ์ ์์์ ํด๋ก์ฆ๋ ์์ค๋ก ๋ง๋ ํด์๋ ์ผ์์ ์
๋๋ค. OpenAI์ ํด๋ก์ฆ๋ ์์ค ์ ๊ทผ ๋ฐฉ์๋ ๋ค๋ฅธ ์ฌ๋๋ค์ด ๋ฐ๋ผ์ก๋ ๊ฒ์ ๋ง์ ์๋ ์์ต๋๋ค. ๊ทธ๋์ ์ฐ๋ฆฌ๋ ํ์๋ค์ด ์ด ๊ณผ์ ์ ํตํด ์ฑ์ฅํ๊ณ ๋
ธํ์ฐ๋ฅผ ์ถ์ ํ๋ฉฐ ํ์ ํ ์ ์๋ ์กฐ์ง๊ณผ ๋ฌธํ๋ฅผ ํ์ฑํ๋ ๋ฐ ๊ฐ์น๋ฅผ ๋๊ณ ์์ต๋๋ค. ์ด๊ฒ์ด ์ฐ๋ฆฌ์ ํด์์
๋๋ค.
์คํ ์์ค, ๋
ผ๋ฌธ ๋ฐํ๋ ์ฌ์ค ๋น์ฉ์ด ๋ค์ง ์์ต๋๋ค. ๊ธฐ์ ์ธ์ฌ์ ๊ฒฝ์ฐ ๋ค๋ฅธ ์ฌ๋๋ค์ด ์์ ์ ํ์ ์ ๋ฐ๋ฅด๊ฒ ๋๋ฉด ํฐ ์ฑ์ทจ๊ฐ์ ๋๋ ์ ์์ต๋๋ค. ์ฌ์ค ์คํ์์ค๋ ์์
์ ์ด๋ผ๊ธฐ๋ณด๋ค๋ ๋ฌธํ์ ํ๋์ ๊ฐ๊น๊ธฐ ๋๋ฌธ์ ์คํ์์ค์ ๊ธฐ์ฌํ๋ฉด ์กด๊ฒฝ๋ฐ์ ์ ์์ต๋๋ค. ๋ํ ๊ธฐ์
์ด ์คํ์์ค์ ์ฐธ์ฌํ๋ ๋ฐ์๋ ๋ฌธํ์ ๋งค๋ ฅ์ด ์์ต๋๋ค.
ํ์ง๋ง ๋ํ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์์ํ ๊ธฐ์ ๋ฆฌ๋์ญ์ด ์ ๋์ ์ธ ์ฐ์๋ฅผ ์ ํ๋ ๊ฒฝ์ฐ๋ ๋๋ญ
๋๋ค. ์ด๋ค ๋ ํฐ ๊ฒ์ ๋ฒ ํ
ํ๊ณ ๊ณ์ ๊ฐ์?
๋ฆฌ์ ์ฌํ: ์ฐ๋ฆฌ๊ฐ ๋ณด๋ ๊ฒ์ ์ค๊ตญ AI๊ฐ ์์ํ ๋ฐ๋ผ์ก์ ์ ์๋ค๋ ๊ฒ์
๋๋ค. ์ฐ๋ฆฌ๋ ํํ ์ค๊ตญ AI์ ๋ฏธ๊ตญ ์ฌ์ด์ 1~2๋
์ ๊ฒฉ์ฐจ๊ฐ ์๋ค๊ณ ๋งํ์ง๋ง, ์ค์ ๊ฒฉ์ฐจ๋ ๋
์ฐฝ์ฑ๊ณผ ๋ชจ๋ฐฉ์ฑ์ ์ฐจ์ด์
๋๋ค. ์ด๊ฒ์ด ๋ณํ์ง ์๋๋ค๋ฉด ์ค๊ตญ์ ํญ์ ์ถ์ข
์์ ๋ถ๊ณผํ ๊ฒ์ด๋ฏ๋ก ์ฝ๊ฐ์ ํํ์ ํผํ ์ ์์ต๋๋ค.
์๋น๋์์ ๋ฆฌ๋์ญ์ ํ ํ์ฌ์ ๋
ธ๋ ฅ๋ง์ด ์๋๋ผ ์๊ตฌ ๊ธฐ์ ์ปค๋ฎค๋ํฐ์ ์
๊ณ ์ ์ฒด๊ฐ ํจ๊ป ๋
ธ๋ ฅํ ๊ฒฐ๊ณผ์
๋๋ค. ๊ทธ๋ค์ ์ฐจ์ธ๋ ๊ธฐ์ ํธ๋ ๋๋ฅผ ํ์
ํ๊ณ ๋ก๋๋งต์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ค๊ตญ์ AI ๊ฐ๋ฐ์๋ ์ด๋ฌํ ์ํ๊ณ๊ฐ ํ์ํฉ๋๋ค. ๋ง์ ๊ตญ๋ด ์นฉ ๊ฐ๋ฐ ์
์ฒด๋ ๊ธฐ์ ์ปค๋ฎค๋ํฐ๊ฐ ๋ถ์กฑํ๊ณ ๊ฐ์ ์ ์ธ ์ ๋ณด๋ง ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ ์ด๋ ค์์ ๊ฒช๊ณ ์์ต๋๋ค. ์ค๊ตญ์ ํ์ฐ์ ์ผ๋ก ๊ธฐ์ ์ต์ ์ ์ ์ ์๋ ์ฌ๋๋ค์ด ํ์ํฉ๋๋ค.
์๊ธ ์กฐ๋ฌ ๊ณํ์ด ์๋์? ํ์ดํ๋ผ์ด์ด๊ฐ IPO๋ฅผ ์ํด ๋ฅ์ํฌ๋ฅผ ๋ถ์ฌํ ๊ณํ์ด๋ผ๋ ์ธ๋ก ๋ณด๋๋ฅผ ๋ณธ ์ ์ด ์์ต๋๋ค. ์ค๋ฆฌ์ฝ๋ฐธ๋ฆฌ์ AI ์คํํธ์
์ ๊ฒฐ๊ตญ ๋๊ธฐ์
์ ์ข
์๋ ์๋ฐ์ ์์์์.
๋ฆฌ์ ์ฌํ: ๋จ๊ธฐ์ ์ผ๋ก๋ ์๊ธ ์กฐ๋ฌ ๊ณํ์ด ์์ต๋๋ค. ์ ํฌ์๊ฒ๋ ๋์ด ๋ฌธ์ ๊ฐ ์๋๋ผ ๊ณ ๊ธ ์นฉ์ ์ถํ ๊ธ์ง๊ฐ ๋ฌธ์ ์
๋๋ค.
ํ๋: ๋ง์ ์ฌ๋๋ค์ด AGI ๊ฐ๋ฐ๊ณผ ์์ ๊ธ์ต์ ์์ ํ ๋ค๋ฅธ ๋
ธ๋ ฅ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค. ์์ ๊ธ์ต์ ์กฐ์ฉํ ์ถ๊ตฌํ ์ ์์ง๋ง, AGI๋ ํฌ์๋ฅผ ํ๋ํ๊ธฐ ์ํด ์ ํด๋ฅผ ๋งบ๋ ๋ฑ ๋์ ๋๊ณ ๋๋ดํ ์ ๊ทผ์ด ํ์ํ ์ ์์ต๋๋ค.
Liang Wenfeng: ๋ ๋ง์ ํฌ์๊ฐ ๋ ๋ง์ ํ์ ์ ๊ฐ์ ธ์ค๋ ๊ฒ์ ์๋๋๋ค. ๊ทธ๋ ์ง ์์๋ค๋ฉด ๋๊ธฐ์
์ด ์ด๋ฏธ ๋ชจ๋ ํ์ ์ ๋
์ ํ์ ๊ฒ์
๋๋ค.
์ด์ ์ ๋ฌธ์ฑ์ด ๋ถ์กฑํด์ ์ง๊ธ์ ์ ํ๋ฆฌ์ผ์ด์
์ ์ง์คํ์ง ์๋ ๊ฑด ์๋๊ฐ์?
๋ฆฌ์ ์ฌํ: ํ์ฌ ๋จ๊ณ๋ ์ ํ๋ฆฌ์ผ์ด์
์ด ์๋ ๊ธฐ์ ํ์ ์ด ํญ๋ฐ์ ์ผ๋ก ์ฑ์ฅํ๋ ์๊ธฐ๋ผ๊ณ ์๊ฐํฉ๋๋ค. ์ฅ๊ธฐ์ ์ผ๋ก๋ ์
๊ณ์์ ์ ํฌ์ ๊ธฐ์ ๊ณผ ๊ฒฐ๊ณผ๋ฌผ์ ์ง์ ํ์ฉํ๋ ์ํ๊ณ๋ฅผ ๋ง๋ค๊ณ ์ถ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ธฐ๋ณธ ๋ชจ๋ธ๊ณผ ์ฒจ๋จ ํ์ ์ ์ง์คํ๊ณ , ๋ค๋ฅธ ๊ธฐ์
๋ค์ ๋ฅ์ํฌ์ ๊ธฐ๋ฐ์ ๋ฐํ์ผ๋ก B2B ๋ฐ B2C ๋น์ฆ๋์ค๋ฅผ ๊ตฌ์ถํ ์ ์๋๋ก ํ ๊ฒ์
๋๋ค. ์์ ํ ์ฐ์
๊ฐ์น ์ฌ์ฌ์ ๊ตฌ์ถํ ์ ์๋ค๋ฉด ์ฐ๋ฆฌ๊ฐ ์ง์ ์ ํ๋ฆฌ์ผ์ด์
์ ๊ฐ๋ฐํ ํ์๊ฐ ์์ต๋๋ค. ๋ฌผ๋ก ํ์ํ๋ค๋ฉด ์ ํ๋ฆฌ์ผ์ด์
์ ๊ฐ๋ฐํ ์๋ ์์ง๋ง, ์ฐ๊ตฌ์ ๊ธฐ์ ํ์ ์ด ํญ์ ์ฐ๋ฆฌ์ ์ต์ฐ์ ์์๊ฐ ๋ ๊ฒ์
๋๋ค.
ํ์ง๋ง ๊ณ ๊ฐ์ด API๋ฅผ ์ ํํ ๋ ๋๊ธฐ์
์ ์ ํ ๋์ ๋ฅ์ํฌ๋ฅผ ์ ํํด์ผ ํ๋ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
Liang Wenfeng: ๋ฏธ๋์ ์ธ๊ณ๋ ์ ๋ฌธํ๋ ๋ถ์
์ ์ธ๊ณ๊ฐ ๋ ๊ฒ์
๋๋ค. ๊ธฐ๋ณธ์ ์ธ ๋ํ ๋ชจ๋ธ์ ์ง์์ ์ธ ํ์ ์ด ํ์ํ๋ฉฐ, ๋๊ธฐ์
์ ์ญ๋์ ํ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ ๋ฐ๋์ ์ต์ ์ด ์๋ ์๋ ์์ต๋๋ค.
Repost from ์ ์ข
ํ์ ์ธ์ฌ์ดํธ
(์ธ์ ๋ ๊ทธ๋ ๋ฏ) ํฉํธ๋ฅผ ์ ๋ค๋ค๋์ ๋ฒค ํฐ์จ์ ๊ธ. ๋ ๋ง์ ์๋ฃ๋ฅผ ์ ํ ํ์ฌ, ๋๋ ์ฌ์ ํ ๋์ผํ ๋ทฐ๋ฅผ ์ ์งํ๋ค.
ํ๋๋ง ๋ง๋ถ์ด๋ฉด, OpenAI์ ์ง์ง ๊ฐ๋ ฅํจ์ ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ์ ๋์ด์ ๋๊ท๋ชจ๋ก ์ปดํจํฐ๋ฅผ ๋ค๋ฃฐ ์ ์๋ ๋ฅ๋ ฅ ๊ทธ ์์ฒด์ ์๋ค๊ณ ์๊ฐํ๋ค.
https://stratechery.com/2025/deepseek-faq/
https://blog.naver.com/mynameisdj/223740494847 (ํ๊ธ ๋ฒ์ญ)
์๋น๋์๊ฐ ์ฌ์ ํ ์ ๋ฆฌํ ์ธ ๊ฐ์ง ์์๊ฐ ์์ต๋๋ค. ์ฒซ์งธ, ๋ฅ์ํฌ์ ์ ๊ทผ ๋ฐฉ์์ด H100 ๋๋ ๊ณง ์ถ์๋ GB100์ ์ ์ฉ๋ ๊ฒฝ์ฐ ์ผ๋ง๋ ์ฑ๋ฅ์ด ์ข์๊น์? ์ปดํจํ
์ ๋ ํจ์จ์ ์ผ๋ก ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ์ฐพ์๋ค๊ณ ํด์ ๋ ๋ง์ ์ปดํจํ
์ด ์ ์ฉํ์ง ์๋ค๋ ์๋ฏธ๋ ์๋๋๋ค. ๋์งธ, ์ถ๋ก ๋น์ฉ์ด ๋ฎ์์ง๋ฉด ์ฅ๊ธฐ์ ์ผ๋ก๋ ์ฌ์ฉ๋์ด ๋์ด๋ ๊ฒ์
๋๋ค. ์ฌํฐ์ ๋๋ธ๋ผ Microsoft CEO๋ ๋ฆ์ ๋ฐค ํธ์ํฐ์์ ์์ฅ์ ๊ฒจ๋ฅํ ๋ฏํ ํธ์์ ํตํด ์ ํํ ์ด๋ ๊ฒ ๋งํ์ต๋๋ค:
์
์งธ, R1 ๋ฐ o1๊ณผ ๊ฐ์ ์ถ๋ก ๋ชจ๋ธ์ ๋ ๋ง์ ์ปดํจํ
์ ์ฌ์ฉํจ์ผ๋ก์จ ์ฐ์ํ ์ฑ๋ฅ์ ์ด๋์ด๋
๋๋ค. AI์ ์ฑ๋ฅ๊ณผ ๊ธฐ๋ฅ์ด ํฅ์๋ ์๋ก ๋ ๋ง์ ์ปดํจํ
์ ์์กดํ๊ฒ ๋๋ ๋งํผ, ์๋น๋์๋ ์ด๋์ ๋ณผ ์ ์์ต๋๋ค!
ํ์ง๋ง ๋ชจ๋ ๊ฒ์ด ์ฅ๋ฐ๋น์ธ ๊ฒ์ ์๋๋๋ค. ์ต์ํ ๋ฅ์ํฌ์ ํจ์จ์ฑ๊ณผ ๊ด๋ฒ์ํ ๊ฐ์ฉ์ฑ์ ์ ์ด๋ ๋จ๊ธฐ์ ์ผ๋ก๋ ๊ฐ์ฅ ๋๊ด์ ์ธ ์๋น๋์์ ์ฑ์ฅ ์คํ ๋ฆฌ์ ์๋นํ ์๊ตฌ์ฌ์ ๋ถ๋ฌ์ผ์ผํต๋๋ค. ๋ชจ๋ธ ๋ฐ ์ธํ๋ผ ์ต์ ํ๋ฅผ ํตํด ์ป์ ์ ์๋ ์ด๋์ ํนํ ์ถ๋ก ์ ๋ํ ๋์์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ํ์ํจ์ผ๋ก์จ ์ป์ ์ ์๋ ์๋นํ ์ด๋์ด ์์์ ์์ฌํฉ๋๋ค. ์๋ฅผ ๋ค์ด, AMD์ ์ด๋ฑํ ์นฉ ๊ฐ ํต์ ๊ธฐ๋ฅ์ ์์ ํ ํํผํ์ฌ ๋
๋ฆฝํ AMD GPU์์ ์ถ๋ก ์ ์คํํ๋ ๊ฒ์ด ํจ์ฌ ๋ ๊ทธ๋ด๋ฏํ ์ ์์ต๋๋ค. ์ถ๋ก ๋ชจ๋ธ์ ๋ํ ์ถ๋ก ์ ์ฉ ์นฉ์ ๋ํ ๋ณด์์ ๋๋ ค์ฃผ๋๋ฐ, ์ด๋ Nvidia์ GPU๋ณด๋ค ํจ์ฌ ๋ ์ ๋ฌธํ๋์ด ์์ต๋๋ค.
์ด์ ๋ฏธ๊ตญ์ ์ ํ์ ํด์ผ ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ๋งค์ฐ ๋
ผ๋ฆฌ์ ์ธ ์ด์ ๋ก ์นฉ ๊ธ์ง ์กฐ์น๋ฅผ ๋ํญ ํ๋ํ๊ณ EU์ ๊ธฐ์ ์ ๊ทผ ๋ฐฉ์์ ๋ฐ์ํ๋ ์นฉ ๋ฐ ๋ฐ๋์ฒด ์ฅ๋น์ ๋ํ ํ๊ฐ ๊ธฐ๋ฐ ๊ท์ ์ฒด์ ๋ฅผ ๋ถ๊ณผํ๋ ๋ฑ ๋ฐฉ์ด ์กฐ์น๋ฅผ ๋ ๋ฐฐ๋ก ๊ฐํํ ์๋ ์๊ณ , ์๋๋ฉด ์ฐ๋ฆฌ์๊ฒ ์ง์ ํ ๊ฒฝ์์ด ์์์ ๊นจ๋ซ๊ณ ์ค์ ๋ก ๊ฒฝ์ํ ์ ์๋ ๊ถํ์ ์ค์ค๋ก ๋ถ์ฌํ ์๋ ์์ต๋๋ค.
๋์ํ์ ์ธ๋ก ๊ณผ์ ์ธํฐ๋ทฐ์์ "์ค๊ตญ๋ ํญ์ ๋ฌด์์น์ฐจ์๊ฐ ๋๊ธฐ๋ณด๋ค๋ ์ ์ฐจ ๊ธฐ์ฌ์๊ฐ ๋์ด์ผ ํฉ๋๋ค."๋ผ๊ณ ๋งํ์ต๋๋ค. "์ฐ๋ฆฌ๋ ๋ฌด์ด์ ๋ฒ์น์ด ํ๋์์ ๋จ์ด์ง๋ ๊ฒ์ ์ต์ํ๋ฉฐ, 18๊ฐ์ ํ์๋ ๋ ๋์ ํ๋์จ์ด์ ์ํํธ์จ์ด๊ฐ ๋์ฌ ๊ฒ์
๋๋ค. ์ค์ผ์ผ๋ง ๋ฒ์น๋ ์ด๋ฐ ์์ผ๋ก ์ทจ๊ธ๋๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ฌ์ค ์ด๊ฒ์ ์๊ตฌ ์ฃผ๋์ ๊ธฐ์ ์ปค๋ฎค๋ํฐ๊ฐ ์ฌ๋ฌ ์ธ๋์ ๊ฑธ์ณ ์ง์น ์ค ๋ชจ๋ฅด๊ณ ๋ง๋ค์ด๋ธ ๊ฒฐ๊ณผ์
๋๋ค. ์ฐ๋ฆฌ๊ฐ ์ด ๊ณผ์ ์ ์ฐธ์ฌํ์ง ์์๊ธฐ ๋๋ฌธ์ ๊ทธ ์กด์ฌ๋ฅผ ๋ฌด์ํ ๊ฒ๋ฟ์
๋๋ค. ๋ง์ ๊ตญ๋ด ์นฉ์ ์ง์ ๊ธฐ์ ์ปค๋ฎค๋ํฐ๊ฐ ๋ถ์กฑํ๊ณ ๊ฐ์ ์ ๋ณด ๋ง ์๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฐํ ์ ์์ต๋๋ค. ์ค๊ตญ์ ๋ฐ๋์ ๊ธฐ์ ์ ์ต์ ์ ์ ์์ผ ํฉ๋๋ค."
์ฃผ์ ์ธ๋ ฅ์ ๋ฐฐ๊ฒฝ
๋๋ค์๊ฐ โ์ฒญ๋ฒ ์ด(ๆธ
ๅ ์ฆ ์ฒญํ๋ยท๋ฒ ์ด์ง๋)โ ๋ฑ ์ค๊ตญ ๋ช
๋ฌธ๋ ์ถ์ ์, ํ๋ถ ์กธ์
์งํ๋ ๋ฐ์ฌ ๊ณผ์ ์ฐ๊ตฌ ์ค์ ํฉ๋ฅํ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
์ยท๋ฐ์ฌ ์ฌํ ์ค์ DeepSeek์์ ์ธํด์ผ๋ก ํ์ฝํ๋ฉด์ ์ฃผ์ ์ฐ๊ตฌ ์ฑ๊ณผ(๋
ผ๋ฌธ, ์ ๊ท ์๊ณ ๋ฆฌ์ฆ ๋ฑ)๋ฅผ ๋ธ ์ฌ๋ก๊ฐ ๋ค์ ์๊ฐ๋ฉ๋๋ค. ์)
MLA(Multi-head Latent Attention) ์ ์์ ์ค ํ ๋ช
์ธ ้ซๅไฝ(๊ฐ์คํ์ญ์ด): ๋ฒ ์ด์ง๋ ๋ฌผ๋ฆฌํ๊ณผ.
ๆพๆบไธ(์ฉก์๋ฉ): ๋ถ๊ฒฝ์ฐ์ ๋(ๅ้ฎ) ์ถ์ , โMLAโ ์ฃผ ์ฐ๊ตฌ์.
้ตๆบๅฎ(์ค์ค์ฆํ): ์นญํ๋ CoAI ์ฐ๊ตฌ๊ทธ๋ฃน์ ๋ฐ์ฌ ๊ณผ์ , Microsoft Research ์ธํด ๊ฒฝํ.
ๆฑ็ช่ฑช(์ฃผ์นํ์ค): ๋ฒ ์ด์ง๋ ์ํํธ์จ์ด ์ฐ๊ตฌ์ ๋ฐ์ฌ ๊ณผ์ , ๋ค์์ ์ต๊ณ ๊ธ ํ์ ๋ํ(ASE, ESEC/FSE) ์์ ๊ฒฝ๋ ฅ.
ไปฃ่พพๅข(๋ค์ด๋ค๋ง์ด), ็็ณๅฎฃ(์๋น์ฌ์), ่ตตๆ้ข(์์ค์ฒญ๊ฐ) ๋ฑ๋ ๊ฐ๊ฐ ๋ฒ ์ด์ง๋, ์นญํ๋์์ ์ปดํจํฐ๋ ์ํยท๋ฌผ๋ฆฌยท์ ๋ณดํ ๋ฑ์ ์ข
์ฌ.
๋ค์ํ ๋ถ์ผ์ ์ ์ ๋ฆฌ๋
ํ ๋ฆฌ๋๊ธ๋ ๋ฐ์ฌ ์กธ์
ํ 4~6๋
์ฐจ ์์ค์ธ ์ ์ ๊ตฌ์ฑ์์ด ๋ง์ต๋๋ค.
ํ๋์จ์ด, ์์คํ
์ธํ๋ผ ์ต์ ํ ์ชฝ์๋ ์๋น๋์, ์๋ฆฌํด๋ผ์ฐ๋ ๋ฑ์์ ๊ฒฝํ์ ์์ ์ ์ ์์ง๋์ด๋ค์ด ํฌ์งํฉ๋๋ค.
์๋ฅผ ๋ค์ด ํ์ฒ๋ฆฌ(ํ๊ณต์ )๋ ๋ชจ๋ธ ํ์ธํ๋ ํ์ ์ด๋๋ ๅดไฟฃ(์ฐ์) ๊ฐ์ ๊ฒฝ์ฐ, ๋ถํญ(ๅ่ช) ๋ฐ์ฌ ์กธ์
ํ MSRA(๋ง์ดํฌ๋ก์ํํธ ์์์์ฐ๊ตฌ์)์์ ์ฐ๊ตฌํ์ผ๋ฉฐ, DeepSeek ํฉ๋ฅ ์ดํ ๋ํ ๋ชจ๋ธ ํ์ ํ๋ จ์ ์ฃผ๋ํฉ๋๋ค.
์ค์ตยท์ธํด์ ์ ๊ทน์ ๊ธฐ์ฌ
๋ฐ์ฌ ๊ณผ์ ์ธํด๋ค์ด ๋
ผ๋ฌธ ๋ฐํ, ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ์ ํต์ฌ ๊ธฐ์ฌ๋ฅผ ํ๋ ์ฌ๋ก๊ฐ ๋์ ๋๋ฉฐ, ์ผ๋ถ ์ธํด์ ์งง์ ๊ธฐ๊ฐ ์ฐ๊ตฌ๋ก๋ ์ค์ํ ๊ธฐ๋ฅ์ ๋ง๋ค์ด๋
๋๋ค.
์) ๅญๆฏ็ฟ(์์ง์น)์ 3D ์์ฑ ๊ด๋ จ ์ฐ๊ตฌ๋ฅผ, ่พๅๅ(์ ํ์ )์ ์ํ ์ ๋ฆฌ ์ฆ๋ช
(DeepSeek-Prover) ๊ด๋ จ ์ผ์ ๋ด๋นํ๋ค๊ฐ ๊ฐ๊ฐ ํด์ธ ๋ํ(์: ์๋ ๋ฒ๋ฌ๋)์ผ๋ก ์ ํ์ ๊ฐ๊ธฐ๋ ํจ.
2. ํ์ด ์ด๋ป๊ฒ ์ผํ๋๊ฐ?
โ์ด๋ฆ๋ง ์์ง ์์โ ์์จ ๋ถ์
DeepSeek ์ฐฝ์
์์ด์ ๋ํ์ธ ๆขๆ้(๋์ํ)์ โ๊ฒฝํ๋ณด๋ค๋ ์ค๋ ฅ์, ์กฐ์ง๋ณด๋ค๋ ์ด์ ์ ํ์
์ ์ค์ํ๋คโ๋ ์ธ์ฌ ์ฒ ํ์ ๊ฐ์กฐํฉ๋๋ค.
์ธ์์ ์ธ ๋ถ์ ๊ตฌ๋ถ์ ์ต์ํํ๋ฉฐ, ๋๊ฐ ์ด๋ค ์ฐ๊ตฌ๋ฅผ ํ๊ณ ์ถ์ผ๋ฉด ํ์ํ GPUยท์ปดํจํ
์์์ ์์ ๋กญ๊ฒ ์์ฒญยทํ์ฉํ ์ ์์ต๋๋ค.
๋ช๋ช ์ฌ๋์ด ๋ชจ์ฌ์ ์์ด๋์ด๊ฐ ๋ ์ค๋ฅด๋ฉด ์น์ธ ์ ์ฐจ ์์ด ํ๋ก์ ํธ๋ฅผ ์์ํ๊ณ , ์ ์ฌ๋ ฅ์ด ๋ณด์ด๋ฉด ํ์ฌ ์ ์ฒด๊ฐ ๋ฆฌ์์ค๋ฅผ ๋ชฐ์์ค ์๋ ์๋ค๋ ์์ ์ํฅ์ ํ์ ๊ตฌ์กฐ๋ฅผ ์ทจํฉ๋๋ค.
๋ํ์ยท๋ฐ์ฌ๊ณผ์ ยท์กธ์
1~2๋
์ฐจ ์ธ๋ ฅ์ด ์ฃผ์ถ์ด ๋๊ณ , ๊ฒฝ๋ ฅ๋ณด๋ค๋ ์ฐ๊ตฌ ์ญ๋์ด๋ ์ฑ์ทจ๋ฅผ ์ฐ์ ์ํ๋ ์ .
AI ์ชฝ์์๋ ์์ฆ ๋๋ผ์ธ ์ ๋๋ก DeepSeek์ ๋ํ ์ด์ผ๊ธฐ ๋ฐ์ ์๋ค. (์์งํ ๋๋ ์์ฆ ๋๋ฌด ๋ง์ ์ด์ผ๊ธฐ๋ฅผ ํ๊ณ ์๊ธด ํ์ง๋ง, ์ง๊ธ๋ง ๊ทธ๋ฌ๋ ๊ฒ์ ์๋๊ณ ๋ ๋ง์ด ํ๋ ๊ฒ์ด๋ ์ฉ์ํด์ฃผ์๊ธฐ๋ฅผ.) ๊ทธ๋ฆฌ๊ณ ์๊ฐ๋ณด๋ค ๋ง์ ํ์ ๊ฐ DeepSeek์ ์ฑ๊ณผ๋ฅผ ํ๊ฐ์ ํํ๋ ค๋ ๊ฒ๊ณผ ๊ด๋ จ์ด ์๋ ๋ฏ ํ๋ค. ChatGPT๋ก ์์ฑํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ๊ฒ์ด๋ค, ์ ์๊ถ์ด๋ ํ๋ผ์ด๋ฒ์์ ๊ด๊ณ ์์ด ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฅํ๋ค, ์ค๊ตญ ์ ๋ถ์ ์ง์์ ๋ฐ์๋ค, ์ค์ ๋ก๋ GPU๋ฅผ ๋ ๋ง์ด ์ฌ์ฉํ๋ค, ๊ทธ๋ฆฌ๊ณ ๊ฒ์ด๊ณผ ๊ด๋ จ๋ ๋ฌธ์ ๋ฑ.
ChatGPT๋ก ์์ฑํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ ๊ฒ ๊ฐ์ง๋ ์๋ค. ํฌ์คํธํธ๋ ์ด๋์ ChatGPT ์์ฑ ๋ฐ์ดํฐ๋ฅผ ์ฐ๋ ๊ฒ์ ๋๋ฌด๋ ํํ ์ผ์ด์ง๋ง (์ฌ์ค ์ค๊ตญ์ ๊ตญํ๋ ๊ฒ์ ์๋๊ณ ๋ฏธ๊ตญ์์๋ ๋ง์ด ์ผ์ด๋๋ ์ผ์ด๋ค) DeepSeek์ด ๊ทธ๋ฌ๋ค๋ ์ฆ๊ฑฐ๋ ์๋ค. ํนํ ๋ค๋ฅธ ์ค๊ตญ ๋ชจ๋ธ๊ณผ๋ ๋ฌ๋ฆฌ ํ๋ฆฌํธ๋ ์ด๋์ Instruction ๋ฐ์ดํฐ๋ฅผ ์ฐ๋ ๊ฒ์ ์กฐ์ฌ์ค๋ฌ์ ๋ ํธ์ด๋ผ ๋๋์ฑ. (ํฌ์คํธํธ๋ ์ด๋์ ๋ํด ์ง์ ์ผ๋ก ๊ด์ฌ์ด ์๋ค๋ฉด ๋ค๋ฅธ ๋ชจ๋ธ์ ์์ฑ ๋ฐ์ดํฐ๋ฅผ ์ฐ์ง ์๋ ๊ฒ์ด ๋ง๋ ๋ฐฉํฅ์ด๊ธฐ๋ ํ๋ค.)
์ ์๊ถ์ด๋ ํ๋ผ์ด๋ฒ์์ ๊ด๊ณ ์์ด ๋ฐ์ดํฐ๋ฅผ ์์งํ์ ๊ฒ์ด๋ผ๋ ๋ถ๋ถ์์๋ ๋ฑํ ์ฆ๊ฑฐ๊ฐ ์์์ง๋ ๋ชจ๋ฅด๊ฒ ๋ค. ์ฌ์ฉ์ ๋ฐ์ดํฐ๋ ์ฌ๋๋ค์ ์๊ฐ์ฒ๋ผ ํ๋ฆฌํธ๋ ์ด๋์ ํฐ ๋์์ด ๋ ์ข
๋ฅ์ ๊ฒ์ ์๋๊ณ ์ ์๊ถ์ด ์ ๋งคํ ๋ฐ์ดํฐ์ ์ฌ์ฉ์ ๊ฐ๋ฅํ๊ฒ ์ง๋ง ๋ฏธ๊ตญ ๊ธฐ์
๋ค๋ ์ด๋ฐ ์ํน์์๋ ์์ ๋กญ์ง ์๋ค. ์ต๊ทผ ๋ฉํ๊ฐ Library Genesis์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ค๋ ์ํน์ ์๊ฐํด๋ณด๋ฉด. (์ด๋ฐ ์ด์ผ๊ธฐ๋ GPT-3์ ์ฌ์ฉ๋ ์ ์ฒด๋ถ๋ช
์ Book2 ๋ฐ์ดํฐ์์๋ถํฐ ์์๋ค.) ํ ๊ฐ์ง ์๋ค๋ฉด ์ค๊ตญ์ ํ์์ ์ธ ์น์ ๋ํ ๋ฐ์ดํฐ์ ์ฉ์ดํ๊ฒ ์ ๊ทผํ ์ ์์์ ๊ฒ์ด๋ผ๋ ๊ฒ ์ ๋์ผ ๋ฏ. (DeepSeek V2 ์์ ์ ์ค๊ตญ์ด ๋ฐ์ดํฐ๊ฐ ์์ด ๋ฐ์ดํฐ๋ณด๋ค ๋ง์๋ค๋ ์ธ๊ธ์ ํ ๊ฒ์ด ์๋ค.)
์ค๊ตญ ์ ๋ถ์ ์ง์์ ๋ฐ๋๋ค๋ ๊ฒ์์๋ Alibaba์ Qwen ๊ฐ์ ๊ธฐ์
๋ค์ ๋นํด์ DeepSeek๊ณผ High Flyer๋ ์ง์์ ๋ฐ๋๋ค๊ณ ํด๋ ํ์์๊ฐ ์๋๊น ์ถ๋ค.
GPU๋ฅผ ๋ ๋ง์ด ์ฌ์ฉํ๋ค๋ ๊ฒ์ ๋น์ฐํ ๋ง์ ๊ฒ์ด๋ค. ์ผ๋จ ์ด์ ์ ๊ณต๊ฐ๋ ๊ฒ์ผ๋ก๋ A100์ 1๋ง ๊ฐ ๊ท๋ชจ๋ก ๊ฐ๊ณ ์์๊ณ , Hopper ์๋ฆฌ์ฆ๋ (Dylan Patel์ด ์ฃผ์ฅํ๋ ๊ฒ์ฒ๋ผ 5๋ง ๊ฐ ๊ท๋ชจ์ผ์ง๋ ๋ชจ๋ฅด๊ฒ ์ง๋ง) ์๋ง 2์ฒ ๊ฐ ๊ท๋ชจ๋ณด๋ค๋ ๋ง์ด ๊ฐ๊ณ ์์ ๋ฏ ์ถ๋ค. ๊ทธ๋ฌ๋ DeepSeek V3 ํ์ต์ ๋
ผ๋ฌธ์์ ์ฃผ์ฅํ๋ 2์ฒ ๊ฐ๋ณด๋ค ๋ง์ GPU๋ฅผ ์ฌ์ฉํ์ ๊ฒ์ด๋ผ๋ ์ฆ๊ฑฐ๋ ์๋ค. ๊ทธ๋ฌ๋ ๋ง์ ์คํ, ๊ทธ๋ฆฌ๊ณ DeepSeek V3๊ฐ ์๊ธฐ๊น์ง ์ง์ํด์จ ์ฐ๊ตฌ๋ค์ ์๊ฐํ๋ฉด ๋น์ฐํ ๋ชจ๋ธ ๊ตฌ์ถ์ ํฌ์
๋ ์ด ์ฐ์ฐ๋ ฅ์ ๊ทธ๋ณด๋ค๋ ๋ง์ ์๋ฐ์ ์๋ค.
๊ฒ์ด์ ๋ํด์๋ DeepSeek V2์์๋ถํฐ "๋ฌธํ์ ์ธ ์ฐจ์ด"๋ฅผ ์ธ๊ธํ๊ณ ์์ผ๋ฏ๋ก ํ๊ณ๊ฐ ์์ ์๋ฐ์ ์์ง๋ง, ๊ธฐ์ ์ ์ธ ์ฑ๊ณผ๋ฅผ ๋
ผํจ์ ์์ด ๊ทธ๋ ๊ฒ ์ค์ํ ์์ธ์ด๋ผ๋ ์๊ฐ์ ๋ค์ง ์๋๋ค.
DeepSeek์ ๊ตณ์ด ๋ณํธํ ์ด์ ๋ ์์ง๋ง ๊ธฐ์ ์ ์ฑ์ทจ์ ๋ํด์๋ ์ ํํ๊ฒ ํ๊ฐํ๋ ์ชฝ์ด ๊ทธ๋ฌ์ง ์๋ ๊ฒ๋ณด๋ค๋ ๋์ ๊ฒ์ด๋ค. ์ฌ์ค DeepSeek์์ ์ง๊ธ๊น์ง ๋์จ ์ฐ๊ตฌ์ ๊ฒฐ๊ณผ๋ค์ ์๊ณ ์๋ ์ฌ๋๋ค์๊ฒ๋ ์์ผ์ค๋ฝ๊ฒ ์ง๊ธ ๋๋ผ๋ ์ฌ๋๋ค์ ๋ฐ์์ด๋ ํ๊ฐ์ ํํ๊ณ ์ ํ๋ ๋๊ธฐ๋ค์ด ์๊ฒฝํ ๊ฒ์ผ ๊ฒ์ด๋ค.
๋ด ์๊ฐ์ ๋ํด์ ๋งํ์๋ฉด.
ํ๊ตญ์์๋ ์ ๋๋ก ์๋ํ๋ค๋ฉด ์ข์ ์ฑ๊ณผ๋ฅผ ๋ฌ์ฑํ ์ ์์๋ค๋ ์ฆ๊ฑฐ์ธ ๊ฒ ๊ฐ๋ค๋ ์๊ฐ์ ํ๋ค. ๋ฌผ๋ก ์์๋ ์ผ์ง๋ง ์ต์ข
DeepSeek V3 ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉํ ๋น์ฉ์ด ๋ชจ๋ธ ๊ตฌ์ถ ๋น์ฉ์ ์ ๋ถ๋ผ๋ ๊ฒ์ ์ณ์ง ์๋ค. ๊ทธ๋ฌ๋ ๊ทธ ๋น์ฉ์ด OpenAI, ๊ตฌ๊ธ, ๋ฉํ, Anthropic ๋ฑ์์ ์ฐ๋ ๋น์ฉ๋ณด๋ค๋ ํจ์ฌ ์ ์ ๊ฒ์ด๋ผ๋ ๊ฒ๋ ์๋ง ๋ง์ ๊ฒ์ด๋ค.
๊ทธ๋ฐ ์ ๋์ ์์์ด ํ๋ฝํ๋ ์์์ ํ์ํ ์์
๋ค์ ์ ํํ ํด๋ธ๋ค๋ฉด ์ฑ๊ณผ๋ฅผ ๋ด์ง ๋ชปํ ์ด์ ๋ ์๋ค. ์ด๊ฒ์ DeepSeek์ ๊ธฐ์ ์ ์ฑ๊ณผ๋ ์์ค์ ํํํ๋ ค๋ ์๋๋ ์๋ค. ๊ทธ๋ฌ๋ ๋๋ ๊ฐ์ธ์ ๋ฅ๋ ฅ๊ณผ ๊ธฐ์ ์ด์์ผ๋ก ํ์ํ ์์
๋ค์ ๊ตฌ๋ถํ๊ณ ๊ทธ๊ฒ์ ์คํํ๋ ๊ฒ ์์ฒด์ ๋ ์ค๋ํจ์ด ์๋ค๊ณ ์๊ฐํ๋ค. ๊ทธ ์์
๋ค์ ์ ํํ๊ฒ ํด๋ด๋ ๊ฒ์๋ ๊ธฐ์ ๊ณผ ๋ฅ๋ ฅ์ด ํ์ํ ์ ์์ง๋ง ๊ทธ์ค์๋ ์ฑ์คํจ์ผ๋ก ์ฑ์ธ ์ ์๋ ์ถฉ๋ถํ ๋ถ๋ถ์ด ์์ ๊ฒ์ด๋ค.
์ฌ์ค ํ์ํ ์์
๋ค์ ํ๋จํ๊ณ ๊ทธ๊ฒ์ ์จ๋นํ ์์์ ํฌ์
ํ๋ ๊ฒ์ด ๊ณง ๊ฐ์ฅ ์ค์ํ ๋ฅ๋ ฅ์ธ ๊ฒ์ผ ์๋ ์๋ค. ๊ทธ๋ฐ ์๋ฏธ์์ ๊ฐ์ธ์ ํ์ํจ์ด๋ ์ฃผ์ด์ง ์์
์ ๋ํ
์ฑ๊ณผ๋ณด๋ค๋ ์ด๋ ํ ์์
์ ์ ํํ๋๊ฐ ํ๋ ์ง์ ์ ์๋์ง๋ ๋ชจ๋ฅด๊ฒ ๋ค.
๋ฐ๋ผ์ ์ธ๋ ฅ์ ์์ค, ๊ท๋ชจ, ํน์ ์๊ฐ ๋ฑ์ ์์ธ ์ด์ ์ ์ง๊ธ๊น์ง ํด์จ ์ ํ๊ณผ ํ๋จ ๊ธฐ์ค์ ๋ํด ์๊ณ ํ๋ ๊ฒ์ด ํ์ํ ์๋ ์๋ค. ์ข์ ํ๋จ ๋๋ ๋ฌด์์ด ์ฌ๋ฐ๋ฅธ ๋ฐฉ๋ฒ์ธ์ง๋ฅผ ์๋ ๊ฒ์ ์ธ๋ ฅ๊ณผ ์์์ด ๋ถ์กฑํ๋๋ผ๋ ๊ฐ์ถ ์ ์๋ค. ์ด์ ๋ํด ๋ตํ ์ ์์ด์ผ ์์์ ์ ์ฝ์ด ์๋ ์ํฉ์์๋ ์ข์ ์ ํ์ ํ ์ ์์์ผ๋ฆฌ๋ผ๊ณ ํ์ ํ ์ ์๋ค. ์์์ ์ผ๋ง๋ ์ง ๋ญ๋นํ ์ ์๋ ๊ฒ์ด๋ฏ๋ก. ์ด ๋ฌธ์ ์ ๋ํด ์ธ๋ ฅ์ ๊ท๋ชจ๋ ์๊ฐ ๊ฐ์ ์์ ์ธ ์ธก๋ฉด๋ค์ ์๊ฐ๋ณด๋ค ์ฐจ์์์ผ์ง๋ ๋ชจ๋ฅธ๋ค.
๊น์ฑํ๋
https://youtu.be/snkOMOjiVOk
์ถ๋ก ์ด๋ผ๊ณ ๋ถ๋ฅผ ์๋ Inference time Scaling์ด๋ผ๊ณ ๋ถ๋ฅผ ์๋ ์๊ฒ ์ง๋ง ๋ณธ์ง์ ์ผ๋ก๋ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋๊ท๋ชจ RL์ ํ์ ๋ ๋ํ๋๋ ์ฐฝ๋ฐ์ ์ธ ํ์์ด๋ผ๋ ๊ฒ. ๊ณผ์ ์ด ์ด๋ ํด์ผ ํ๋๊ฐ๋ฅผ ๊ธฐ์ ํ๋ ๋์ ๋ชจ๋ธ์ด ๊ทธ๊ฒ์ ์ค์ค๋ก ์ฐพ๊ฒ ํด์ผ ํ๋ค๋ ๋ฅ ๋ฌ๋์ ์ฌ๊ณ ๋ฐฉ์์ผ๋ก ๋ค์ ๋์๊ฐ์ผ ํ๋ ์๊ฐ. ๊น์ฑํ๋
์ถ๋ก (Reasoning) ๋ชจ๋ธ, RL ์ ๋ชฉ ์ ๋ง
ํ์ฌ ๋ชจ๋ธ(์: OpenAI)๊ณผ์ ๋น๊ต
์ง๋ฌธ์๋ โOpenAI์์ ๋ชจ๋ธ๋ณ๋ก Reasoning ๋ชจ๋๊ฐ ์กด์ฌํ๋ค๋๋ฐ, Anthropic์๋ ๋น์ทํ ๋ชจ๋ธ์ด ์๋โ๊ณ ์ง๋ฌธ.
ํ์๋ Anthropic ์ธก ์ ๊ทผ์ โ์ด๋ถ๋ฒ์ ์ผ๋ก ์ถ๋ก ๋ชจ๋ธ vs. ์ผ๋ฐ ๋ชจ๋ธโ๋ก ๊ตฌ๋ถํ๊ธฐ๋ณด๋ค, RL(๊ฐํํ์ต)์ ํตํด ๋ชจ๋ธ์ด ๋ ๊น๊ฒ ์ฌ๊ณ ยท๋ฐ์ฑ(reflection)ยทํ์(search)ํ๊ฒ ๋ง๋๋ ๋ฐฉํฅ์ด๋ผ ์ค๋ช
.
๊ฒฐ๋ก ์ ์ผ๋ก โ์๊ฐํ๋ ๋ชจ๋ธโ๊ณผ โ๊ทธ๋ฅ ๋น ๋ฅด๊ฒ ๋ต๋ณํ๋ ๋ชจ๋ธโ์ ๋ณ๋๋ก ๋๊ธฐ๋ณด๋ค, ์์ฐ์ค๋ฝ๊ฒ ๋ชจ๋ธ์ด ์ํฉ์ ๋ฐ๋ผ ์์ฝ๊ฒ ์ถ๋ก ํ๋ ์ชฝ์ ์งํฅ.
๊ฐํํ์ต(RL) ๋๊ท๋ชจ ๋์
Anthropic์ ์์ผ๋ก ์ ์ ๋ ๋ง์ RL ๊ธฐ๋ฒ์ ๋ชจ๋ธ ํ์ต์ ํ์ฉํ ๊ฒ์ด๋ฉฐ, ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ด โ์ค์ค๋ก ์ฌ๊ณ ๊ณผ์ ์ ์ ๊ฒโํ๊ณ ํ์ง ๋์ ๋ต๋ณ์ ๋์ถํ๊ฒ ๋ง๋ค ๊ฒ.
โํ
์คํธ ์๊ฐ(Test-Time) ์ปดํจํธโ ํน์ โ์ถ๋ก ์๊ฐ ์ค๊ณโ์ ๋ํ ๋
ผ์๊ฐ ์์ง๋ง, Anthropic์ โ๊ฒฐ๊ตญ ๋๊ท๋ชจ RL ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ ์ค์ค๋ก ์ฌ๊ณ ๋ฅผ ๊ฐํโํ๋ ๋ฐฉ์์ด ๋ ์์ฐ์ค๋ฝ๋ค๊ณ ๋ด.
2017~2018๋
์ดํ Scaling Laws ๊ด์ฐฐ
ํ์๋ ์ด๋ฏธ 2017๋
๋ฌด๋ ต๋ถํฐ โ๊ณ์ฐ ์์์ ๊ณ์ ๋๋ฆฌ๋ฉด ๋ชจ๋ธ ์ฑ๋ฅ์ด ์ ๋ฐฉ์๋ก ํฅ์๋๋คโ๋ผ๋ ์ค์ผ์ผ๋ง ๋ฒ์น์ ๋ฏฟ์ด ์์.
๊ณผ๊ฑฐ์๋ ์ผ์ ์์ค ๋ถํ์ค์ฑ์ด ์์์ผ๋, ์ต๊ทผ 3~6๊ฐ์ ์ฌ์ด ๊ทธ ๋ถํ์ค์ฑ์ด ํฌ๊ฒ ์ค์๊ณ , ์ค์ ๋ก ์ฌ๋ฌ ์งํ์์ ๋ชจ๋ธ์ด ์ฌ๋๋ณด๋ค ๋ฐ์ด๋ ๋จ๊ณ๊ฐ ๊ฐ๊น์์ง๊ณ ์๋ค๊ณ ์ง๋จ.
โAI ๋ฐ์ ์ด ์๊ฐ๋ณด๋ค ๋น ๋ฅด๋คโ
ํ์๋ AI ๋ฐ์ ์ด ๊ทน๋๋ก ๋น ๋ฅด๋ฉฐ, ํฅํ 2~3๋
๋ด์ ๊ฑฐ์ ๋ชจ๋ ์ง์ยทํน์ ์์
์์ ์ธ๊ฐ๋ณด๋ค ์ฐ์ํด์ง ๋ชจ๋ธ์ด ๋์ฌ ์ ์๋ค๊ณ ์ค๋ช
.
์ด์ ๋ํ ๊ธ์ ์ ํจ๊ณผ์ ๋ถ์ ์ ๋ฆฌ์คํฌ ๋ชจ๋๊ฐ ์ปธ๊ธฐ์, โAI ์
๊ณ๊ฐ ์ด๋ฅผ ์ ๋๋ก ์ธ์ํ๊ณ ์์งํ ์ํตํด์ผ ํ๋คโ๊ณ ๊ฐ์กฐ.
๋
ธ๋์์ฅ ์ํฅ (๋จ๊ธฐ vs ์ฅ๊ธฐ)
๋จ๊ธฐ์ ๊ด์ (1~3๋
์ ๋)
์๋ก์ด ๊ธฐ์ ์ ๊ธฐ์กด ์ผ์๋ฆฌ๋ฅผ ๋์ฒดํ ์ ์์ง๋ง, ๋ฐ๋๋ก โ๊ธฐ์ ํ์ฉ ๋ฅ๋ ฅ์ด ์๋ ์ธ๋ ฅโ์ ์์ฐ์ฑ์ ํฌ๊ฒ ๋์ฌ โ๋ณด์์ฌ(Complementary)โ ์ญํ ์ ํ ์๋ ์์.
Anthropic์ ์ด์ ๊ธฐ์ ํ์ ์ฌ๋ก์ฒ๋ผ, โ์ง๋ฌด ์ผ๋ถ๋ฅผ AI๊ฐ ๋์ ํ๋ฉด, ์ฌ๋์ด ๋ ์ฐฝ์์ ยท๊ณ ์ฐจ์์ ๋ถ๋ถ์ ์ง์คํด ์
๋ฌด ํจ์จ์ ๋์ผ ์ ์๋คโ๋ โ๋น๊ต์ฐ์โ ๊ด์ ์ ๊ฐ์กฐ.
๋ค๋ง ๊ธฐ์
๋ค์ด AI๋ฅผ ์ด๋ป๊ฒ ๋์
ํ๋๋(๋์ฒด vs. ๋ณด์)์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ง ์ ์์ผ๋ฉฐ, Anthropic์ โ๋ณด์ํ ํํธ๋์ญโ ๋ฐฉํฅ์ ์ง์ง.
์ฅ๊ธฐ์ ๊ด์
ํ์๋ โ๊ฒฐ๊ตญ์๋ AI๊ฐ ์ธ๊ฐ๋ณด๋ค ๋ ๋ฐ์ด๋ ๋จ๊ณ, ์ฌ์ง์ด ๋ก๋ด๊ณผ ๊ฒฐํฉํด ๋ฌผ๋ฆฌ ๋
ธ๋๊น์ง ๋์ฒดํ๋ ์์ โ์ด ์ฌ ๊ฒ์ผ๋ก ์์(์์ ๋ถ๋ช
, ๋ค๋ง 2027๋
์ ํ ๊ฐ๋ฅ์ฑ ์ธ๊ธ).
๊ทธ๋๋ โ์ธ๊ฐ์ ์์กด๊ฐ, ๊ฐ์น, ๊ฒฝ์ ์ฒด๊ณ, ๋ถ๋ฐฐ ๋ฐฉ์โ ๋ฑ์ ๊ทผ๋ณธ์ ์ธ ์ฌ์ค๊ณ๊ฐ ํ์.
๋ชจ๋ ์ธ๊ฐ์๊ฒ ์ ์ฉ๋๋ ์ํฉ์ด๋ผ๋ฉด โ์ (ๅ
จ) ์ธ๋ฅ๊ฐ ๊ฐ์ ๋ฐฐ๋ฅผ ํ๋ค๊ณ ๋ณผ ์๋ ์์ง๋ง, ๋ง์ผ 30%๋ง ๋์ฒด๋๊ณ 70%๋ ๊ทธ๋๋ก๋ผ๋ฉด ํฐ ์ฌํ ๊ฐ๋ฑ์ด ์๊ธธ ๊ฒโ์ด๋ผ๊ณ ์ฐ๋ ค.
1. ๋ชฉํ์ ์ ์ : ์ฑ๋ฅ์ด ์ต์ฐ์ ์ด๋ค
โLong CoT(๊ธด ์ฒด์ธ ์ค๋ธ ์ํธ)โ๋ฅผ ํ์ฉํ LLM ๊ฐํํ์ต(RL)์ผ๋ก ๋ ๋์ ๋ฌธ์ ํด๊ฒฐ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ ์ ํจ.
๋น์ฉ๊ณผ ์๋(ํ ํฐ ์ฌ์ฉ ์ฆ๊ฐ ๋ฑ)๋ ๊ถ๊ทน์ ์ผ๋ก ๋ฌด์ด์ ๋ฒ์น ๋ฑ์ผ๋ก ํด๊ฒฐ ๊ฐ๋ฅํ๋ฏ๋ก, โ์ฐ์ ์ฑ๋ฅ์ ์ต๊ณ ๋ก ๋์ด์ฌ๋ฆฐ๋คโ๊ฐ ์ต์์ ์์น.
2. ๋ฌธ์ ์ ๊ทผ๋ณธ ๊ตฌ์กฐ ํ์
๊ธฐ์กด ์งง์ ์ถ๋ก (CoT)๋ณด๋ค ๊ธด ์ถ๋ก (Long CoT)์ด ํ์ โ โ์์ ๋กญ๊ฒ ์๊ฐํ๋ ๊ณผ์ ์ ๋ชจ๋ธ์๊ฒ ๋งก๊ธฐ๋, ์ ๋ต์ ์ ๋๋ก ๋ง์ถ๋์ง ์ฌ๋ถ๋ง ๋ช
ํํ ํ๋จโํ๋ค๋ ์ ์ด ํต์ฌ.
๋ช
ํํ ์ ๋ต์ด ์ ๊ณต๋๋(๋๋ ์ ํํ ๊ฒ์ฆ ๊ฐ๋ฅํ) ๊ณผ์ (์: ์ํ, ์ฝ๋ฉ ๋ฑ)์์ RL์ ์ ์ฉํด์ผ ์ฌ๋ฐ๋ฅธ ๋ณด์์ ์ค ์ ์์.
๋ชจ๋ธ์ด ์ค์ค๋ก โ๊ฒ์(Search) ๊ณผ์ โ์ ์ํํ๋๋ก ํด์ผ ํ๋ฉฐ, ์ธ์์ ์ผ๋ก โMCTS๋ Agentic ๊ตฌ์กฐโ ๊ฐ์ ์๊ฒฉํ ํ์ ๊ฐ์ ํ๋ฉด ์คํ๋ ค ๋ชจ๋ธ ์ญ๋์ ์ ํํจ.
3. ๊ทผ๋ณธ ํด๋ฒ: In-Context RL + Exploration
๊ธธ๊ณ ์์ ๋ก์ด ์ฌ๊ณ ๊ณผ์ ์ โํ ๋ฒ์ ๋ฉ์์ง(ํน์ ๋ฌธ๋งฅ)โ ์์ ๋ด์, ๊ณง๋ฐ๋ก ๋ณด์์ ํผ๋๋ฐฑ๋ฐ๋ ๊ตฌ์กฐ โ ์ธ์ปจํ
์คํธ RL.
๋ชจ๋ธ์ด ์ค๊ฐ์ ์ค์ํด๋, ์ต์ข
์ ์ผ๋ก ๋ต์ ๋ง์ถ๋ฉด(์ฆ, โํ์ต ๊ณผ์ ์์ ์ค์๋ ํ์ฉ, ๊ฒฐ๊ณผ๋ฌผ๋ง ์ ํํ๋ค๋ฉด ๋ณด์โ) ๊ทธ๊ฒ์ผ๋ก ์ถฉ๋ถํ๋ค๋ โ๋งฅ๋ฝ ๋ฐด๋ํธ(Contextual Bandit)โ ๊ด์ .
๊ฐ์นํจ์(๋ฐธ๋ฅ ํจ์)๋ ๋ณต์กํ ๊ตฌ์กฐ ์์ด, โ๋ต์ด ๋ง์ผ๋ฉด +, ํ๋ฆฌ๋ฉด โโ ์์ REINFORCE๋ฅ ์ ๊ทผ์ด ์์ฐ์ค๋ฝ๊ณ , ๊ตฌ์กฐ์ ์ธ ๊ฐ์ (์: MCTS)๋ ์ง์.
4. Long CoT๊ฐ ์ค์ค๋ก ํ์ฅ๋๋ ์ด์
RL ๊ณผ์ ์ ์งํํ๋ฉด, ๋ชจ๋ธ์ ์ ํ๋๋ฅผ ์ฌ๋ฆฌ๊ธฐ ์ํด ์์ฐ์ค๋ฝ๊ฒ ์ ์ ๋ ๊ธด ์ฌ๊ณ ๊ณผ์ ์ ํ์ฉ โ ํ ํฐ ๊ธธ์ด๊ฐ ํ์ต ๊ณผ์ ์ค์ ์๋ฐ์ ์ผ๋ก ์ฆ๊ฐํจ.
โ๋ชจ๋ธ์ด ์ฑ๋ฅ์ ์ฌ๋ฆฌ๋ ๋ฐ ํ์ํ ๋งํผโ ์ค์ค๋ก ๋ ๊ธธ๊ฒ ํ์ํ๊ณ ๋ฐ์ฑ(reflection)ํ๋ฉฐ, ์๋ชป๋ ์๋์์ ๋ฐฐ์ฐ๋ ํจํด์ ํ์ต.
5. ์ฃผ์ ํ
์ดํฌ์ด์จ์ด(First Principles)
๋์ ์ฑ๋ฅ(Performance)์ ๋ฌด์๋ณด๋ค ์ฐ์ ํ๋ค. ๋น์ฉ๊ณผ ์๋ ๋ฌธ์ ๋ ํ์์๋ก ํด๊ฒฐ ๊ฐ๋ฅ.
๋ณด์์ด ์ ํํด์ผ ํ๋ค(์ค์ ์ ๋ต์ ์๋ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค).
๋ชจ๋ธ์ด ์๊ฐ์ ๊ตฌ์กฐ๋ฅผ โ๋ด์ฌ์ ํ์โ ํํ๋ก ์์ ๋กญ๊ฒ ํผ์น ์ ์๊ฒ ํ๋ค(Structured PlanningโงMCTS๋ ์ ํ์ ).
ํ์ต์ โ์ค์๊ฐ ์ผ์ด๋ ์ ์์โ์ ์ ์ ๋ก โ ์ต์ข
์ ๋ต์ด ๋ง์ผ๋ฉด ๊ทธ ๊ณผ์ ์ ๋ชจ๋ ์ธ์ ํ๋ค๋ ์์ผ๋ก ๋จ์ํํ๋ค.
๋ชจ๋ธ์ด ์ค์ค๋ก โ๊ฒ์(Search)+์๊ธฐ๋นํ(Self-Critique)โ์ ์ํํ ์ ์๋๋ก ํ๋ค.
์ค์ RL ํ๋ จ์์, (๋ฌธ์ ยท๋ต๋ณ) ์์ ๋ํ ๋ณด์ ํจ์๋ฅผ ์ ์ํด(์ฝ๋: ํ
์คํธ์ผ์ด์ค ํต๊ณผ ์ฌ๋ถ, ์ํ: ์ ๋ต๊ฒ์ฆ ๋ชจ๋ธ ๋ฑ) ๋ชจ๋ธ์ด ๋ต์ ์์ฑํ๋ฉด ๊ทธ ์ฑ๋ฅ์ ์ฆ์ ๋ณด์์ผ๋ก ํ์ฐํฉ๋๋ค.
์คํ์๊ฐ ์๋ ์ค๊ฐ ๋จ๊ณ๋ผ๋, ์ต์ข
์ ์ผ๋ก ๋ต์ ๋ง์ถ๋ฉด ํจ๋ํฐ ๋์ ํ์ต์ ํ์ํ ๋ค์ํ โ์๋ ๊ณผ์ โ์ ๊ฐ์ ธ๊ฐ๋ ์์ผ๋ก ์ค๊ณํด, ๋ชจ๋ธ์ด ์ฌ๋ฌ ๊ฒฝ๋ก๋ฅผ ์คํํ๊ณ ์ ์ฐจ ๊ฐ์ ํ๋๋ก ์ฅ๋ คํฉ๋๋ค.
์ ์ฑ
์ต์ ํ๋ ๊ธฐ์กด โ์จ๋ผ์ธ ๋ฏธ๋ฌ ๋์ผํธ(online mirror descent)โ ๋ณํ ๋ฐฉ์์ ์ฐ๋, ์คํํด๋ฆฌ์(off-policy) ์ํ๋ง, ๊ธธ์ด ํจ๋ํฐ(length penalty), ์ปค๋ฆฌํ๋ผ ์ํ๋ง(์ฌ์ด ๋ฌธ์ โ์ด๋ ค์ด ๋ฌธ์ ์) ๋ฑ์ ๋์
ํด ํจ์จ์ ๋์์ต๋๋ค.
ํนํ ๋กฑ-CoT ๊ฐํํ์ต ์, ๋งฅ๋ฝ ๊ธธ์ด๊ฐ ๋งค์ฐ ๊ธธ์ด์ง๋ฏ๋ก โPartial Rollout(๋ถ๋ถ ๋กค์์)โ์ด๋ผ๋ ๋ฐฉ์์ ์จ์ ์ด์ ์ ์์ฑํ ๊ธด ํ ํฐ ์ํ์ค ์ค ์ฌํ์ฉ ๊ฐ๋ฅํ ๊ตฌ๊ฐ์ ๋นผ๋ด ์ฌ์ํ๋งํ๋ ์์ผ๋ก ์์คํ
์์์ ์ ์ฝํฉ๋๋ค.
4/Long2short ๊ธฐ๋ฒ(ํ ํฐ ํจ์จํ)
์ต์ข
์ ์ผ๋ก ์๋ง์ ๊ธธ์ด(Short-CoT)๋ก๋ ๋์ ์ ํ๋๋ฅผ ์ ์งํ๋๋ก, โlong-CoT๋ก ํ์ต๋ ๋ฒ ์ด์ค ๋ชจ๋ธโ์ ๋ค์ โ์งง์ ์ถ๋ก ์ฉโ์ผ๋ก ์์ถ ์ ๋ จํ๋ ๋จ๊ณ์
๋๋ค.
๊ธธ์ด ํ๋ํฐ์ ๋ชจ๋ธ ๋ณํฉ(merge), DPO, Rejection Sampling ๋ฑ์ ๋ณํํ์ฌ, ๊ฐ๋ฅํ ํ ๊ฐ๊ฒฐํ ํ ํฐ ์ฌ์ฉ์ผ๋ก๋ ๋์ ์ ๋ต๋ฅ ์ ๋ด๋ ค ํฉ๋๋ค.
https://arxiv.org/abs/2501.12599
โPretraining ๋ฐ์ดํฐ ํ๊ณ โ RL ๊ธฐ๋ฐ โ์๋ก์ด ์ถโ์ ์ด์ด๋ณผ ์ ์์๊น?โ
โข ๊ธฐ์กด LLM ํ์ฅ์ฑ: ๋ณดํต โ๋ค์ ํ ํฐ ์์ธกโ(next token prediction)์ผ๋ก ๊ฑฐ๋ ๋ฐ์ดํฐ์
์ ๋ง์ถฐ ์ฌ์ ํ์ต์ ์งํ.
ํ๊ณ: ํ์ต ๊ฐ๋ฅํ ๋ฐ์ดํฐ๊ฐ ๊ฒฐ๊ตญ ์ ํ๋ ์๋ฐ์ ์์.
โข ๋์(First Principle): โ๋ชจ๋ธ์ด ๋ณด์(reward)์ ํตํด ์ค์ค๋ก ํ์(explore)ํ๋ ์ถโโ์ฆ, RL์ ๋๊ท๋ชจ LLM์ ๋์
ํ๋ฉด, ๋ ์ด์ ์ ์ ๋ฐ์ดํฐ์๋ง ์์กดํ์ง ์์๋ ๋จ.
๋ฌธ์ : ์ง๊ธ๊น์ง RL+LLM ์ฑ๊ณผ๊ฐ ๊ฒฝ์๋ ฅ์ด ๋์ง ์์์.
โKimi k1.5โ๊ฐ ์ด ๋ฌธ์ ํด๊ฒฐ์ ๋ชฉํ: โ๋๊ณ ๊ธด ์ปจํ
์คํธ์์, RL๋ก ์ฆ๊ฐ์ ํ์๊ณผ ์๊ธฐ-์์ ๋ฅ๋ ฅ์ ํ์ตํ๋๋ก ํ์ฌ, ๊ฒฐ๊ณผ์ ์ผ๋ก OpenAI o1 ๋ฑ ์ต์ ๊ฑฐ๋๋ชจ๋ธ๊ณผ ๊ฒฌ์ค ๋งํ ๊ฐ๋ ฅํ Reasoning ๋ชจ๋ธ์ ๋ง๋ค ์ ์๋๊ฐ?โ
โLong Context + Policy Optimization ๊ฐ๋จํ๊ฐ ๊ด๊ฑดโ
Long context scaling
์์ด๋์ด: โ๋ฌธ์ ๋ฅผ ํ ๋, ์ถฉ๋ถํ ๊ธด ๋งฅ๋ฝ(128K ํ ํฐ ๋ฑ)์ ์ฃผ๋ฉด, ๊ฑฐ์ โํ๋๋ ์๊ณ ๋ฆฌ์ฆโ์ฒ๋ผ ๋ชจ๋ธ์ด ์๋ฐ์ ์ผ๋ก ๊ผฌ๋ฆฌ์ ๊ผฌ๋ฆฌ๋ฅผ ๋ฌด๋ ์ถ๋ก ์ ํ ์ ์์ง ์์๊น?โ
๋ฌธ์ : ๊ธธ์ด๊ฐ ๋๋ฌด ๊ธธ๋ฉด RL ๊ณผ์ ์ด ๋นํจ์จ์ ์ด๊ฑฐ๋ โ์ค๋ฒ-์ฝํน(์๋ต์ด ๋๋ฌด ๊ธธ์ด์ง๋ ํ์)โ์ด ๊ฑฑ์ ๋จ. โ ์ด๋ฅผ ์ํ โpartial rolloutโ ๋ฑ ์ ๋ฌธ ์ต์ ํ๊ฐ ํ์.
Simplistic RL framework (๊ฐ๋จํ ์ ์ฑ
์ต์ ํ ๊ธฐ๋ฒ)
๊ธฐ์กด์ MCTS(่ํ
์นด๋ฅด๋ก ํธ๋ฆฌ์์น), Value ํจ์, Process Reward๋ฅผ ์ ์ฐ๊ณ ๋ ์ถฉ๋ถํ ํ์ฅ ๊ฐ๋ฅํจ์ ์๋.
โ์คํ-ํด๋ฆฌ์ ์ํ๋ง + relative entropy ์ ๊ทํโ โ ๊ฑฐ๋ํ LLM์๋ ์ ํฉํ โmirror descentโ ๋ฐฉ์์ ์ฝ๊ฒ ๊ตฌํ.
๊ฐ๋จํ ์ฅ์ : ๋ณต์กํ ๋ณด์กฐ ๋ชจ๋ ์์ด๋ ์ถฉ๋ถํ โ๋ค์ํ ํ์โ๊ณผ โ์ ๋ต๋ฅ โ์ ๋์์ ๋์.
์๋ฃ ๊ตฌ์ฑ, ๋ชจ๋ธ ๊ตฌ์กฐ, ํ์ต ๋ ์ํผ: ์ฌํ ์คํ์์ค์ ๋ค๋ฅธ ์
์ฌ์ ํ์ต(Pretraining)์ ๊ธฐ์กด์ฒ๋ผ ๊ฑฐ๋ ํ
์คํธยท์ฝ๋ยท์ํยท๋น์ (์ด๋ฏธ์ง) ๋ฐ์ดํฐ๋ฅผ ํผํฉ
๋๊ท๋ชจ ๋ฉํฐ๋ชจ๋ฌ(์ฌ์ง+๊ธ) ์
๋ ฅ ์ฒ๋ฆฌ ๊ฐ๋ฅ โ ์ด๋๋ โ๊ธธ์ด ํ์ฅโ๊ณผ โํ์ง ๋์ ํํฐ๋งโ์ด ์ค์
โVanilla SFT(์ง๋ํ์ต)โ ํ, โLong-CoT Supervised Fine-Tuningโ์ ์ถ๊ฐ๋ก ๋์
์ฒซ ๋จ๊ณ์์ ์ผ๋ฐ ๋ชฉ์ SFT๋ก ๊ธฐ์ด ์ฌ์ฉ์ ์๋ต ํํ ํ๋ณด โ ๋ค์ ๋จ๊ณ์์ ๊ธธ๊ณ ์ ๊ตํ ์ฒด์ธ์ค๋ธ์ํธ(CoT)๋ฅผ ๋ฐ์ดํฐ๋ก ๋ง๋ ํ ๋ค์ ํ์ธํ๋.
RL ๋จ๊ณ โ
์๋ก ๋ง๋ RL PromptSet(์์ ๋ ์ง์๋ค)
Long-CoT Warmup(์๋์ด์ง๋ง ์ฌ๋ ์์ค์ผ๋ก ๊น๋ํ๊ณ ๊ธด ์ถ๋ก ๊ฒฝ๋ก ์์๋ฅผ ์ฃผ์
)
์ค์ RL Policy Optimization: off-policy ์ถ๊ฐ ์ํ(+๋ง์ด๋์ค ๋ณด์๋ถ)์ ๋ชจ๋ ์ด์ฉ, โrejection sampling / partial rollout / length penaltyโ ๋ฑ ์ต์ ํ ๊ธฐ๋ฒ ๊ฒฐํฉ.
โ๋ถ๋ถ ๋กค์์(Partial Rollout)โ: ๋๋ฌด ๊ธด ๋ต๋ณ์ ํ ๋ฒ์ ์ ๋ถ ์์ฑํ์ง ์๊ณ ์๊ฒ ๋๋ , ์ค๊ฐ๋จ๊ณ(์ด์ ํ์ต๊ฒฐ๊ณผ) ์ฌํ์ฉ.
ํ์ต ์ค์ผ์ค ํจ์จ์ ๋์ฌ โ๊ธด ํด์ค ์์ฑโ๋ ๊ฐ๋ฅํ๊ฒ ๋ง๋ฆ.
โ๋จ์ํ RL๊ณผ ๋กฑ-์ปจํ
์คํธ๋ง์ผ๋ก๋ ์ต์ฒจ๋จ ์์ค ๋ฌ์ฑโ
Kimi k1.5 Long-CoT
์ํ(MATH 500) 96.2 / AIME 77.5 ๋ฑ, OpenAI o1๊ณผ ๋๋ฑ.
LiveCodeBench, Codeforces ๋ฑ ์ฝ๋ฉ ๊ฒฝ์ ์งํ๋ ์ฐ์.
๋น์ (MathVista, MMMU) ํฌํจํด ๋ฉํฐ๋ชจ๋ฌ reasoning ์ฑ๋ฅ STOA ๊ธฐ๋ก.
Kimi k1.5 Short-CoT
Long-CoT ๋ชจ๋ธ์ด ๋๋ฌด ํ ํฐ ๋ง์ด ์ฐ๋ ๋ฌธ์ (โ์ค๋ฒ์ฝํนโ) โ โLong2Shortโ ๊ธฐ๋ฒ(๋ชจ๋ธ ์์ถ, DPO, ์งง์ ์๋ต ์ ๋ณ ๋ฑ)์ผ๋ก ์งง์ CoT๋ง์ผ๋ก๋ ๊ธฐ์กด GPT-4o/Claude3.5๋ณด๋ค ํจ์ฌ ์ข์ ๊ฒฐ๊ณผ.
AIME 2024์ Pass@1์ด 60.8 ๋ฑ ๊ด๋ชฉํ ๋งํ ํฅ์.
โRL+LongCont = ๋ ๋ค๋ฅธ ์ฌ๋กํ ์ด๋ ธ๋ค, ๊ณ์ ํ์ฅ ๊ฐ๋ฅโ
โ์ ์ ๋ฐ์ดํฐ ์์ง์ด ์๋๋ผ, ๋ชจ๋ธ์ด ์์ฒด์ ์ผ๋ก ๋ณด์์ ํตํด explorationํ๋ ์ถ์ด ์๋กญ๊ฒ ์ด๋ฆผ โ ๋ฐ์ดํฐ ํ๊ณ๋ฅผ ๋์ ์ ์๋ค.โ
โข ๋์ ํด๊ฒฐ: ๋๋ฌด ๊ธธ๊ณ ๋ณต์กํ rollouts ์ฒ๋ฆฌ ์ํด โpartial rollout / length penalty / simplistic mirror descentโ ๋ฑ ํตํฉ.
โข ์คํ ์ฆ๋ช
: ์ฌํ ๋ณต์กํ(๊ฐ๋ น Monte Carlo tree search, Value function) ์์ด๋ simple RL ์ฒด๊ณ์ ๊ธธ์ด์ง ์ปจํ
์คํธ๋ง์ผ๋ก o1๊ธ ์ฑ๋ฅ ๋ฌ์ฑ ๊ฐ๋ฅ.
โข ๋ฉํฐ๋ชจ๋ฌ ๋ถ์ผ์์๋ ์ ์ฉ ๊ฐ๋ฅ: ์๊ฐ+ํ
์คํธ ์ตํฉ๋ ๋๊ท๋ชจ RL์ด, ๊ธฐ์กด LLM ํ๊ณ๋ฅผ ๋์ด ์๋ก์ด Reasoning ํจ๋ฌ๋ค์ ์๋.
๋ฐ์ดํฐ:
์ธ์ด(ํ
์คํธ) ๋ฐ์ดํฐ
์์ดโง์ค๊ตญ์ด ํ
์คํธ, ์ฝ๋, ์ํ/์ถ๋ก , ์ง์(ํ์ ์๋ฃ ๋ฑ)์ ํฌํจํ 5๊ฐ์ง ์์ญ์ ์ค์ ์ ์ผ๋ก ๋ค๋ฃน๋๋ค.
์ค๋ณต ๋ฌธ์๋ฅผ ์ ๊ฑฐํ๊ณ (with ์๋ฒ ๋ฉ ์ ์ฌ๋ ๋ถ์), ๊ธ์ ๊นจ์ง, ํ์ ์ค๋ฅ, ์คํธ์ฑ ํ
์คํธ ๋ฑ์ ๊ฑธ๋ฌ๋ด๋ ๊ท์น ๊ธฐ๋ฐ ํํฐ๋ง ๊ณผ์ ์ ๊ฑฐ์นฉ๋๋ค.
FastText, LLM ๊ธฐ๋ฐ ์ค์ฝ์ด๋ง ๋ฑ์ ์ํํด, ๊ฐ ๋ฌธ์์ ์ธ์ด์ ํ์ง๊ณผ ์ฃผ์ ์ ํฉ๋๋ฅผ ํ๊ฐํ ๋ค, ์ค์ํ ๋ฌธ์๋ฅผ ์
์ํ๋ง(up-sampling), ๋ฎ์ ํ์ง ๋ฌธ์๋ฅผ ๋ค์ด์ํ๋ง(down-sampling) ํฉ๋๋ค.
์ฝ๋ ๋ฐ์ดํฐ
๋ค์ํ ๊ณต๊ฐ ์ ์ฅ์(์: Git ๋ฆฌํฌ์งํ ๋ฆฌ)์์ ์ถ์ถํ ์์ค์ฝ๋๋ฅผ ์ ์ ํด ์ฌ์ฉํฉ๋๋ค.
JSON, YAML ๋ฑ ๋งํฌ์
์ธ์ด๋ ๋น์ค์ ์ค์ด๊ณ , PythonยทC++ยทJava ๋ฑ ๋ํ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ฅผ ๊ณจ๊ณ ๋ฃจ ํฌํจํ๋๋ก ์กฐ์ ํฉ๋๋ค.
์ํยท์ถ๋ก ๋ฐ์ดํฐ
์ํ ๋
ผ๋ฌธยทํ์ ์๋ฃยท์ํ ๋ฌธ์ (์: ๋ํ ๋ฌธ์ ) ๋ฑ์ ์์งํ๊ณ , ์์, ํน์๊ธฐํธ ๋ฑ์ด ์ ํํ ์ธ์๋๋๋ก ๋ง์ถคํ OCR ๋ชจ๋ธ์ ์ถ๊ฐ ์ ์ฉํ์ต๋๋ค.
๋ ๋จ๊ณ ํํฐ๋ง์ ๊ฑฐ์ณ(1) ๊ฐ๋จํ FastText ๋ถ๋ฅ๊ธฐ๋ก ๋๋ต ๋ถํ์ ๋ฌธ์ ์ ๊ฑฐ, (2) ์ ์ ๋ LLM์ผ๋ก ์ธ๋ถ ํ์ง ๊ฒ์ฌ), ๋์ด๋ ๋๊ณ ์๋ฏธ ์๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ์ต๋๋ค.
๋ฉํฐ๋ชจ๋ฌ(์ด๋ฏธ์ง+ํ
์คํธ) ๋ฐ์ดํฐ
์บก์
(caption) ๋ฐ์ดํฐ(์ด๋ฏธ์ง ๊ธฐ์ ), ์ด๋ฏธ์ง์ ํ
์คํธ๊ฐ ์์ธ(interleaving) ๋ฐ์ดํฐ, OCR(๊ธ์ ์์ญ์ด ํฌํจ๋ ์ด๋ฏธ์ง) ๋ฐ์ดํฐ, ์๊ฐโง์ง์ ๊ด๋ จ ์๋ฃ ๋ฑ์ ํญ๋๊ฒ ์์งํ์ต๋๋ค.
ํ์ํ ๊ฒฝ์ฐ, ์ด๋ฏธ์ง๋ ์ฐจํธยท์์ ์ด๋ฏธ์ง ๋ฑ์ OCR ๋ชจ๋ธ๋ก ๋ค์ ์ถ์ถํด ํ
์คํธ ํํ๋ ํจ๊ป ํ์ตํ๋๋ก ํ์ต๋๋ค.
์ด๋ฏธ์ง์ ํ
์คํธ๊ฐ ๊ธด ๋งฅ๋ฝ์์ ์๋ก ๊ต์ฐจ ์ฐ๊ฒฐ๋๋(interleaved) ์์๋ค์ ์ถฉ๋ถํ ํฌํจํ์ฌ, ๊ธด ์๊ฐ์ ๋ฌธ๋งฅ์ ์ฒ๋ฆฌํ๋ ๋๊ท๋ชจ ํ์ต์ ์ํํ์ต๋๋ค.
ํ์ต ๋ฐฉ์
Kimi k1.5๋ ํฌ๊ฒ ๋ค์ ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ ํ์ตํ๋ฉฐ, ์ต์ข
์ ์ผ๋ก โ๋ฉํฐ๋ชจ๋ฌ RL(๊ฐํํ์ต)โ ๊ธฐ๋ฐ์ ๋กฑ ์ฒด์ธ์ค๋ธ์๋(long-CoT) ๊ธฐ๋ฒ์ ๋์
ํด ๋ชจ๋ธ ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ฅ์์ผฐ์ต๋๋ค.
1/ ๊ธฐ๋ณธ ์ฌ์ ํ์ต(Pretraining)
์์ ๊ตฌ์ถ๋ ๋๊ท๋ชจ ํ
์คํธยท์ด๋ฏธ์ง ๋ฐ์ดํฐ์
์ผ๋ก ์ธ์ด๋ชจ๋ธ(๋์ฝ๋ Transformer) ๊ธฐ๋ฐ์ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ํ๋ จํฉ๋๋ค.
(1) ํ
์คํธ ์ค์ฌ ํ์ต โ (2) ์๊ฐยท์ธ์ด ์ตํฉ(vision-language) โ (3) ๊ธด ๋งฅ๋ฝ ์ฒ๋ฆฌ ๋ฅ๋ ฅ ํ์ฑํ(์ต๋ 128k ํ ํฐ) ์์ผ๋ก ์ ์ง์ ์ผ๋ก ์ํํฉ๋๋ค.
์ด๋ RoPE(๊ฐ๊ฐ์ ์์น ์๋ฒ ๋ฉ์ ํฌ๊ฒ ํ์ฅํ๋) ๊ธฐ๋ฒ, ๋ฉํฐ๋ชจ๋ฌ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋ณ๋ ๋น์ ํ์(freezing & unfreezing), 32kโ128k ํ ํฐ์ผ๋ก ์ ์ง์ ๋งฅ๋ฝ ๊ธธ์ด ํ์ฅ ๋ฑ์ด ํ์ฉ๋ฉ๋๋ค.
2/ ์ํผ๋ฐ์ด์ฆ๋ ํ์ธํ๋(SFT) ๋ฐ ๋กฑ-CoT ์ฌ์ ํ์ต
์ ํ๋ ๊ณ ํ์ง ๋ฌธ์ โง๋ฌธ๋ต์ ๋ฑ์ ๋ํด ๋ชจ๋ธ ์ถ๋ ฅ์ ๋ฐ์, ์ฌ๋์ด ์ง์ ํ๊ฐํ๊ฑฐ๋(์คํํ QA) ๋ฃฐ๋ฒ ์ด์คยทํ
์คํธ์ผ์ด์ค๋ก ์๋ ๊ฒ์ฆํ๋(์ฝ๋ยท์ํ ๋ฌธ์ ) โ๊ฑฐ๋ถ ์ํ๋ง(rejection sampling)โ์ผ๋ก ์ ๋ต๋ฅ ๋์ ์์๋ฅผ ํ๋ณดํฉ๋๋ค.
์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ชจ๋ธ์ ์ถ๊ฐ ๋ฏธ์ธ์กฐ์ ํ ๋ค, ํนํ โ๊ธธ๊ณ ์์ธํ ๋จ๊ณ์ ์ถ๋ก โ(Long-CoT)์ ๋ฐ๋ก ํ์ต์์ผ ์ค๊ฐ ์ฌ๊ณ ๊ณผ์ (PlanningยทReflectionยทBacktracking ๋ฑ)์ ์ ํํํ๋๋ก ๋ง๋ญ๋๋ค.
3/๊ฐํํ์ต(RL) ๋จ๊ณ
https://youtu.be/kYWUEV_e2ss
๋ฌธ์ ์ ์: โ์ธ๊ฐ์ด ์์ธํ ๊ฐ๋ฅด์น๋ ๊ฒ vs. ๋ชจ๋ธ์ด ์ค์ค๋ก ํ์ตํ๋๋ก ๋๊ธฐ๋ฅผ ๋ถ์ฌํ๋ ๊ฒโ
โข ๊ธฐ์กด ์ ๊ทผ๋ฒ: ์ธ๊ฐ ํ๋ค์ด ์ฌ๊ณ ๋ฐฉ์(์์์
๊ตฌ์กฐยท์ธ๊ฐ ์ง๊ด)์ ๊ธฐ๋ฐํด ๋ชจ๋ธ์ โ์ธ์ดํยท๋
ผ๋ฆฌโ ๋ฑ์ ๋ช
์์ ์ผ๋ก ๊ฐ๋ฅด์น๋ ค ๋ฆ.
ํ๊ณ: ์ฌ๋์ด โ์ด๋ป๊ฒ ์๊ฐํ๋์งโ๋ฅผ ์๋ฒฝํ ์ดํดํ ๊ฒ๋ ์๋๊ณ , ์ด๊ฒ์ด ๊ณง ๋ชจ๋ธ์ ์ต์ ํด๋ฒ๊ณผ ์ผ์นํ์ง๋ ์์.
โข ๋์(First Principle): โ๋ชจ๋ธ์ด ๋ค๋ฃฐ ๋ฐฉ๋ํ ๋ฐ์ดํฐ์ ๋์ ๊ณ์ฐ๋ ฅ(Compute)์ ์ด์ฉํด, ๊ทธ ์์ฒด๋ฅผ '์ฝํ ์๊ทธ๋(Weak Incentive)'๋ก ์ผ์ โ์ค์ค๋ก ์ฌ๊ณ ยทํ์ตโ์ ์ด์ง.โ
์: โ๋ค์ ํ ํฐ ์์ธกโ์ด๋ผ๋ ๋จ์ ๋ชฉํ๋ง ๋์ ธ์ฃผ๋(๊ต์ X), ์์ญ์ตยท์์กฐ ๊ฐ ๋ฌธ๋งฅ์ ํด๊ฒฐํ๋ ค ์ ์ฐ๊ฒ ํ๋ฉด, ์์ฐ์ค๋ฝ๊ฒ ์ธ์ด ์ดํด/์ถ๋ก /์๋ฌธ ๋ฑ์ด ์๊ฒจ๋จ(์ธ์ผํฐ๋ธ O).
โ๋ฌด์ ํ Scalabilityโ๊ฐ ์ ์ ๊ฐ ๋๋ ํ์ฌ ํ๊ฒฝ
์ ์ ์กฐ๊ฑด:
ํ๋์จ์ด/์ปดํจํ
์ด ์ง์์ ์ผ๋ก ๋ฐ์ (๋น์ฉ ์ ๊ฐ์๋ ๋ํ ์์ฒญ๋จ).
๊ธฐ์กด๋ฌผ๋ฆฌ(์ฌ๋๊ณผ ๊ฐ์ ์๊ฐ์ ์ ์ฝ)๋ โ์ด๋ก ์ XXโ ์์ค์ผ๋ก ์ํ.
ํ๋ ์ง์นจ:
(1) โํจ์ฌ ๋ง์ computeโ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ํํ๋๋ก, ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ต์์ ์ฌ์ ๊ฐ์ (Structure)์ผ๋ก ์ ์ง.
(2) ์ฌ๋์ด โ๋ฌธ์ ํด๊ฒฐ ๋จ์โ๋ฅผ ์ง์ ์ค๊ณํ์ง ๋ง ๊ฒ(์ซ์๊ฐ ์ปค์ง์๋ก ๊ทธ ์ฌ์ ๊ฐ์ ์ด ๋ณ๋ชฉ์ด ๋จ).
(3) โ์ธ๊ฐ ์ง์โ ๋์ , ๋ชจ๋ธ์ด โ๋ฐ์ดํฐ์ ๋ชฉํ(์:๋ค์ ํ ํฐ ์์ธก, ์ฑ๊ณต ์ฌ๋ถ ๋ณด์ ๋ฑ)โ๋ฅผ ๋ฐํ์ผ์ ์๋ฐ์ ์ผ๋ก ์ผ๋ฐํ๋(General) ๋ฅ๋ ฅ์ ์ฐพ๋๋ก.
โNext Token Predictionโ์ด ์ด๋ป๊ฒ ์ผ๋ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ๋ณ๋๊ฐ
ํํ: ์น ์ค์ผ์ผ(์์ญ์ต~์์กฐ ๋ฌธ์ฅ), ๊ฐ ๋ฌธ์ฅ์์ ๋งค ๋ค์ ํ ํฐ์ ๋งํ๋ ๊ฒ์ด ์ ๋ถ.
๊ฒฐ๊ณผ:
(1) ์ธ์ดํ์ ์ง์๋ถํฐ, ์ํยท์ฝ๋ฉยท๋
ผ๋ฆฌ๊น์ง โํ์ต์๊ฐ ์ค์ค๋ก ๊ฐ์ฅ ์ ๋ฆฌํโ ์ผ๋ฐ๊ธฐ์ ์ ํฐ๋.
(2) ์ธ๊ฐ์ด ๋ณ๋ ๊ต๊ณผ๊ณผ์ ์์ด๋, โ์๋ง์ ๋ฌธ๋งฅ์ ์ฒ๋ฆฌํด์ผ ํ๋ ์ธ์ผํฐ๋ธโ ๋๋ฌธ์ ์ ์ ๋ก ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ๋ ฅ(โEmergent Abilityโ) ํ๋.
(3) ์์ ๋ชจ๋ธ๋ก๋ ๋ถ๊ฐ๋ฅํ์ง๋ง, ์ผ์ ๊ท๋ชจ ๋์ผ๋ฉด(์ฒซ ์๋ฆฌ ์ฐจ์์์ โ์ถฉ๋ถํ ๊ณ์ฐ ์์+๋ฐ์ดํฐ=๊ฐ๋ฅโ) ์๋นํ ์ง์ ๋ฅ๋ ฅ์ด โ๋์ฐโ ์ถํ.
โEmergent Abilityโ์ ์ค์ผ์ผ๋ง: ์ปค์ง๋ ๋ชจ๋ธ์ โ์ฝํโ ๋ชฉํ๋ง ๋์ ธ๋ ๋ณ๋ ๋ฅ๋ ฅ์ด ์๊ธฐ๋ ์ด์
โ์์ ๋ชจ๋ธ ๊ธฐ์คโ์์ ๋ณด๋ฉด, ์ฌ๋์ ๊ทธ ๋ชจ๋ธ ํ๊ณ ์ ํจ ๋ฒ์๋ง ๋ชฉ๊ฒฉํ๊ณ ๋ โ์ ๋๋คโ๊ณ ๊ฒฐ๋ก ๋.
โข ํ์ง๋ง ์ปดํจํ
์์์ด ๋๋ฉด์, ์ ํ ๋ค๋ฅธ ๋ฒ์(scales)์์ ์๊ณ์ ์ ๋์ผ๋ฉด, โ์์ฐ๋ฐ์ ์ถ๋ก ๋ฅ๋ ฅโ ํญ์ฆ.
๋น์ : ๋ฌผ๋ฆฌ ์คํ์ด๋ผ๋ฉด โ๋ช ๋
ํ ๋ฐ๋ ๋ฒ์น์ ์๋ค.โ โ AI๋ โํ๋์จ์ด ์ถ์ โ์ด ๋ฒ์น ์์ฒด๋ฅผ ๋ฐ๊พธ๋ ๊ฒฉ.
๋ฐ๋ผ์ ๋น ๋ฅธ โ๊ด์ฑ ์์ดโ ์ฌ๊ณ ์ ํ(โUnlearning ๊ธฐ์กด ๊ฐ์ โ)์ด ํ์.
์์ผ๋ก์ ๋ฐฉํฅ: โ๋ชจ๋ ๋ฌธ์ ๋ฅผ ์ธ์ผํฐ๋ธ๋ก ์ ์ํ๋ผโ
Next Token Prediction โ ์ผ์ข
์ โ์ฝํ ๋ณด์โ์ผ๋ก ์ธ์ดยท์ถ๋ก ์ง์ ํ์ตํ๋ ๊ฒ์ฒ๋ผ, โ์ ํ ์๋ตโยทโ์ฌ์ค ๊ฒ์ฆโ ๋ฑ ๋ค๋ฅธ ๋ชฉํ๋ค๋ ์ฝํ์ง๋ง ๊ด๋ฒ์ํ๊ฒ ์ค์ ๊ฐ๋ฅ.
โข ๊ฑฐ๋๋ชจ๋ธ ์๋: ๊ณผ๊ฑฐ์ โํ์ต๋น์ฉ์ด ๋๋ฌด ์ปค์โ ๋นํจ์จ์ด ๋ฌธ์ ์์ง๋ง, ์ด์ ๋ ์ปดํจํ
์ด ๋ฌด์ ํ์ ์ผ๋ก ์ฆ๊ฐ ๊ฐ๋ฅ โ ์ด ๋ฐฉ๋ฒ์ด ์คํ๋ ค ํจ์จ์ .
โข ๊ฒฐ๋ก : โ์ ๋ ๊ฒ ๊ฐ์ ๋ณด์ด๋ ๋จ์ ๋ณด์ ๊ตฌ์กฐโ + โ๋ ํฐ ๋ชจ๋ธ/๋ฐ์ดํฐโ = ๋ชจ๋ธ์ด ๋ณธ์ง์ ์ผ๋ก ํจ์ฌ ๊น์ ๊ธฐ์ (์: ์๊ธฐ๋ฐ์, ์ํ, ์น๋ฐ์ถ๋ก ๋ฑ)์ ์ฐพ์ ํ ์์ด ๋จ.
์ด์ ์ ์ธ๊ธํ๋ ๊ฒ์ฒ๋ผ ์ง๊ธ ๊ฐ์ฅ ์ค์ํ ๋ฌธ์ ๋ o1์ ์ฌ์ฉ๋ ์ถ๋ก ๋ฅ๋ ฅ์ ์ํ ๋ฐฉ๋ฒ์ ์์๋ด๋ ๊ฒ์ด์๋ค. ๋ฌผ๋ก o1์ ๋ฐฉ๋ฒ์ด ๋ฌด์์ธ์ง๋ ๊ธฐ๋ฐ์ด๋ ์ฌ์ ํ ์ ํํ ์ ์๋ ์๋ค. ๊ทธ๋ฌ๋ o1๊ณผ ๋๋ฑํ ์์ค์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ ๋ฐฉ๋ฒ์ ์ด์ ์๋ ค์ก๋ค. ๊ทธ๊ฒ๋ ํ๋ฃจ๋ง์ ๋ ๊ฐ์ง ์ฌ๋ก๋ก.
https://github.com/deepseek-ai/DeepSeek-R1
https://github.com/MoonshotAI/Kimi-k1.5
ํฅ๋ฏธ๋ก์ด ๊ฒ์ ์ด ๋ ๊ฐ์ง ์ฌ๋ก ๋ชจ๋ ๊ณตํต๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค๋ ๊ฒ์ด๋ค. ๊ทธ์ ๋ชจ๋ธ์ ์ต์ข
์ถ๋ ฅ ๊ฒฐ๊ณผ์ ์ ๋ต ์ฌ๋ถ๋ง์ผ๋ก (์ํ์ด๋ผ๋ฉด ์ ๋ต๊ณผ์ ์ผ์น ์ฌ๋ถ, ์ฝ๋ฉ์ด๋ผ๋ฉด ์ปดํ์ผ๋ฌ๋ฅผ ํตํ ์ ๋ ํ
์คํธ ํผ๋๋ฐฑ ๋ฑ) RL์ ํ๋ ๊ฒ์ด๋ค. ์ง๊ธ๊น์ง ์ถ๋ก ๋ฅ๋ ฅ์ ์ํ ๋ง์ ์๋๋ค์ด ๋์๊ณ ์ด ์๋๋ค์ ๋์ฒด๋ก Process Reward Model (PRM)์ ์ฌ์ฉํด์ CoT์ ๊ฐ ์คํ
์ ๋ํด Reward๋ฅผ ์ฃผ๊ฑฐ๋ MCTS๋ฅผ ํ๋ ๊ฒ์ด ์ฃผ๋ฅ์๋ค.
๊ทธ๋ฐ๋ฐ ๊ทธ๋ฐ ์ ์ถฉ์ ์ธ ๋ฐฉ๋ฒ์ด๋ ๋ช
์์ ์ธ ํ์์ ์ ํ ์ฌ์ฉํ์ง ์๊ณ ๊ฒฐ๊ณผ ๋ณด์(Outcome Reward)๋ง์ผ๋ก ์ถ๋ก ๋ฅ๋ ฅ์ ๋ชจ๋ธ์ ์ฃผ์
ํ๋๋ฐ ์ฑ๊ณตํ ๊ฒ์ด๋ค.
์ฌ์ค o1์ด MCTS ๊ฐ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋๊ฐ๋ ๊ณ์ํด์ ๋
ผ์์ ์ธ ๋ฌธ์ ์๋ค. TรLU 3์์ ์ ๋ต์ ๊ธฐ๋ฐํ RL์ (RLVR) ํตํด ์ฐฝ๋ฐ์ ์ธ ๋ฅ๋ ฅ์ด ๋ํ๋ ์ฌ๋ก๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์์ด ์๋๋ผ Outcome Reward๋ฅผ ํตํด ์ถ๋ก ๋ฅ๋ ฅ์ด ๋ฑ์ฅํ ์ ์๋ค๋ ์ฃผ์ฅ๋ ์์๊ณ (https://www.interconnects.ai/.../openais-o1-using-search...) ํ์์ ๋ต์ด ์๋๋ผ๋ ๋ง๋ ์์์ง๋ง (https://x.com/denny_zhou/status/1870551510741811644) ์ด์จ๋ ์ง๊ธ๊น์ง ๊ฐ์ฅ ์ธ๊ธฐ ์์๋ ๋ฐฉ๋ฒ์ ํ์์ด์๋ค. (https://arxiv.org/abs/2501.04682)
๊ทธ๋ ๋ค๋ฉด ์ Outcome Reward ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ์ด ์ฃผ๋ชฉ์ ๋ฐ์ง ๋ชปํ์๊น? ์ด๋ ์ด ๋ฐฉ๋ฒ์ด ์ฑ๊ณต์ ์ด๊ธฐ ์ํด์ ๋ฒ ์ด์ค ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ถฉ๋ถํ ๋์์ผ ํ๊ณ ์ถฉ๋ถํ ๋์ด๋์ ์์ ๋ฌธ์ -์ ๋ต ๋ฐ์ดํฐ๊ฐ ํ์ํ๊ธฐ ๋๋ฌธ์ผ ๊ฒ์ด๋ค.
๋ฅ ๋ฌ๋์์ ํํ๊ฒ ์ผ์ด๋๋ ๋ฌธ์ , ์ฆ ์ ๊ตํ ๋ฐฉ๋ฒ์ด ๊ท๋ชจ๋ฅผ ํค์ด ๋จ์ํ ๋ฐฉ๋ฒ์ ๋ฐ๋ฆฌ๋ ํ์์ ๋ฐ๋ณต์ด๋ผ๊ณ ํ ์ ์๊ฒ ๋ค.
PRM์ ๋ฌธ์ ๋ ๋ฌด์์ผ๊น? ์ผ๋จ PRM์ ์ ์ฉํ์๋ฉด CoT์์ Process๊ฐ ๋ ๋จ์๋ฅผ ์ค์ ํด์ผ ํ๋ค. ์ด ์คํ
๋ค์ ๋ํ ํ์ต ๋ ์ด๋ธ ๋ํ ํ์ํ๋ค. ์ด ๋ ์ด๋ธ ๊ตฌ์ถ์ ์์ฃผ ์ด๋ ค์ด ์์
์ด๊ธฐ์ ์ ๋ต ์ฌ๋ถ๋ฅผ ํตํด ๋ ์ด๋ธ์ ๋ถ์ฌํ๋ ๋ฐฉ๋ฒ์ด ์ธ๊ธฐ๋ฅผ ์ป์์ง๋ง ์ด๋ ๊ฒ ํ์ตํ ๋ชจ๋ธ์ ํ์ต ๋๋ฉ์ธ ๋ฐ์ผ๋ก ๋์ด๊ฐ๋ฉด ์ฑ๋ฅ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค. (https://arxiv.org/abs/2501.07301) ๋ํ ์ ์ด์ ๋ชจ๋ธ ๊ธฐ๋ฐ์ด๊ธฐ์ ๋ชจ๋ธ์ ๋ถ์ ํ์ฑ ๋ํ ๋ฌธ์ ๊ฐ ๋๋ค.
MCTS๋ ์ด๋จ๊น? MCTS๋ฅผ ์ํด์ ์ ํํ Value ๋ชจ๋ธ์ด ํ์ํ๊ณ ์ด๋ฅผ ํ๋ณดํ๋ ๊ฒ์ด ๋ฌธ์ ๊ฐ ๋๋ค.
PRM๊ณผ MCTS ๋ชจ๋ CoT์ ์ผ์ ํ ๊ตฌ์กฐ๋ฅผ ๋ถ์ฌํ๊ฒ ๋๋ค. PRM์์๋ Reward์ ๋จ์๊ฐ ๋๋ ์คํ
๋ค์ด ์ ํด์ ธ์ผ ํ๊ณ MCTS๋ ํ์ ๊ณต๊ฐ์ด ์ค์ ๋์ด์ผ ํ๋ค.
๊ทธ๋ฆฌ๊ณ ๋ฅ ๋ฌ๋์ ๊ฐ์ฅ ์ค์ํ ๊ตํ์ ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ ๋ฐฉ๋ฒ์ ๊ตฌ์กฐ๋ฅผ ๋ถ์ฌํด์๋ ์ ๋๋ค๋ ๊ฒ์ด๋ค.
๋ฌผ๋ก ์์ผ๋ก๋ PRM์ด๋ MCTS๊ฐ ๋์์ด ๋์ง ์์ ๊ฒ์ด๋ผ๊ณ ๋งํ ์๋ ์๋ค. ๊ทธ๋ฌ๋ ๋จ์ํ ๋ฐฉ๋ฒ์ Scaling ํ๋ ๊ฒ์ด ํด์ผ ํ ์ฒซ ๋จ๊ณ์ธ ๊ฒ๋ ์ฌ์ค์ด๋ค.
์ด๋ฐ ์ถ๋ก ๋ชจ๋ธ๋ค์ ํตํด ๋ฒ ์ด์ค ๋ชจ๋ธ์ ๋ ๊ฐํํ ์ ์๋๊ฐ, ๊ทธ๋ฆฌ๊ณ ์ง๊ธ ์ ๋ต์ ์ ์ ์๋ ๋ฌธ์ ๋ค์ ๋ํด ํ์ตํ ๋ชจ๋ธ์ด ์ฐ๋ฆฌ๊ฐ ๋ชฉํํ๋ ์ ๋ต์ ์์ง ๋ชจ๋ฅด๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ ๋๋ฌํ ์ ์๋๊ฐ ๋ฑ ์๊ฐํ๊ณ ์ฐ๊ตฌํ ๋ฌธ์ ๋ค์ ๋ง์ด ์๋ค. ์ค์ฉ์ ์ผ๋ก๋ ๋ ๋ค์ํ ๊ณผ์ ๋ค์ ๋ํด ์ ๋ต ์ฌ๋ถ๋ฅผ ๊ณ์ฐํ ์ ์๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ฐํ๋ ๊ฒ๋ ์ค์ํ๋ค.
๊ทธ๋ฌ๋ ์ผ๋จ ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ํ์ธํ๋ค๋ฉด ๊ทธ ์ง์ ์์ ๋์๊ฐ๋ ๊ฒ์ ํ๊ฒฐ ์ฝ๋ค.
#
DeepSeek-R1 ๋ฆฌํฌํธ์์ ๋งํ๋ฏ Distillation์ ๋ชจ๋ธ์ ์ถ๋ก ๋ฅ๋ ฅ์ ๋ถ์ฌํ๋ ์์ฃผ ์์ฌ์ด ๋ฐฉ๋ฒ์ด๋ค. ์ฌ์ค o1์ ์ฌํํ๋ค๊ณ ์ฃผ์ฅํ ๋ง์ ์๋๋ค์ด Distillation์ ์์กดํ๊ณ ์๋ค.
(๋๋ ์ธ๋ถ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ฌ์ฉํด ๋ชจ๋ธ์ ํ์ต์ํค๋ ๊ฒ์ Distillation์ด๋ผ๊ณ ๋ถ๋ฅด๋ ๊ฒ์ ๋ฐ๋ํ๊ณ ์ถ์ง๋ง ์ด๋ฏธ ๋๋ฌด ๊ด๋ฒ์ํ ์ฉ๋ฒ์ด ๋์ด๋ฒ๋ ธ์ผ๋ ์ด์ฉ ์ ์์ ๋ฏ ์ถ๋ค.)
์ฌ์ค ์์ ๋ชจ๋ธ์์๋ RL๋ณด๋ค Distillation์ด ๋ ํจ๊ณผ์ ์ด๋ผ๊ณ ์ธ๊ธํ๊ณ ์๊ธฐ๋ ํ๋ค. RL์ด ์ ๋๋ก ์๋ํ๋ ค๋ฉด ๊ฐ๋ ฅํ ๋ฒ ์ด์ค ๋ชจ๋ธ์ด ๋ท๋ฐ์นจ๋์ด์ผ ํ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฌ๋ ๋ง์ฐฌ๊ฐ์ง๋ก ๋ฆฌํฌํธ์์ ์ธ๊ธํ๋ ๊ฒ์ฒ๋ผ ๋ชจ๋ธ์ ๋ฅ๋ ฅ์ ๊ฒฝ๊ณ๋ฅผ ํ์ฅํ๋ ค๋ฉด ๋ ๊ฐ๋ ฅํ ๋ฒ ์ด์ค ๋ชจ๋ธ๊ณผ ๋๊ท๋ชจ RL์ ํตํ ์๋ฐ์ ์๋ค. ๋ฐ๋ผ์ ์ง์ ์ผ๋ก ํฅ๋ฏธ๋ก์ด ๊ฒ์ ๊ทธ ๊ฒฝ๊ณ๋ฅผ ํ์ฅํ๋ ์์
๊ณผ ๊ทธ ์์ญ์ ์๋ค.
#
DeepSeek์ ์ฐฝ๋ฆฝ์๊ฐ ์ธํฐ๋ทฐ์์ AGI์ ๋๋ฌํ๊ธฐ ์ํ ๊ธฐ์ ์ ํ์ ์ ๋์ ํ์ฌ์ ๊ธฐ์ ์ ํตํ ์์ฉ์ด๋ ์ด์ค ์ฐฝ์ถ์ ์ง์คํ ์๊ฐ์ ์๋ค๋ ์์ผ๋ก ์ธ๊ธํ ์ ์ด ์๋ค. (https://www.chinatalk.media/.../deepseek-ceo-interview...) ์ด ๊ธฐ์ ์ ํ์ ์ ๋ํ ์ง์ค์ด ์ง๊ธ DeepSeek์ด ๊ณต๊ฐํ๊ณ ์๋ ์ฑ๊ณผ์ ๋๋ ฅ์ด์์ผ๋ฆฌ๋ผ๊ณ ์๊ฐํ๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๊ฒ์ด ์คํ๋ ค ํฉ๋ฆฌ์ ์ธ ์ ํ์ผ ์ ์๋ค. ํ์ฌ ์์ค์ LLM์ ๋ฅ๋ ฅ์ ์ ํ์ ์ด๊ณ ๋ฐ๋ผ์ ๊ทธ๊ฒ์ ์ ์ฉํ ์ ์๋ ๋ถ์ผ์ ์ฐฝ์ถํ ์ ์๋ ์ด์ค ๋ํ ์ ํ์ ์ผ ์๋ฐ์ ์๋ค. ๊ทธ๋ ๋ค๋ฉด ์ง๊ธ ๊ฐ๋ฅํ ์์ญ์์ ์ด์ค์ ์ง๋ด๋ ค ์๋ํ๋ ๊ฒ๋ณด๋ค๋ ๊ฐ๋ฅํ ์์ญ์ ๋๋ฆฌ๋ ๊ฒ์ ์ง์คํ๋ ๊ฒ์ด ๋์ ์ ์๋ค.
์ด ์์ญ์ ๋ฐ์ ์๋๋ฅผ ๊ณ ๋ คํ์ ๋ ์ด ๊ธฐ์ ์ด ๋๋ฌํ ์ ์๋ ๋ฒ์์ ๋ํด ๊ฐ๋ ํ ์ ์๊ฒ ๋๊ธฐ๊น์ง ๊ฑธ๋ฆด ์๊ฐ์ ๊ทธ๋ฆฌ ๋ง์ง ์๋ค. ์ฆ ๊ต์ฅํ ์ฅ๊ธฐ์ ์ธ ํฌ์๊ฐ ํ์ํ์ง๋ ์์ ๊ฒ์ด๋ผ๋ ์๋ฏธ์ด๋ค. (๋ฌผ๋ก ๋น์ฉ์ ํด ์ ์๋ค.) ๊ทธ๋ ๋ค๋ฉด ๊ตณ์ด ์ง๊ธ ์ป์ ์ ์๋ ์กฐ๊ธ์ ์ด์ค์ ์ํด ์กฐ๋ฐ์ฌ์ ๋ผ ํ์๋ ์๋ค.
๊น์ฑํ๋
Endi mavjud! Telegram Tadqiqoti 2025 โ yilning asosiy insaytlari 
