uz
Feedback
Continuous Learning_Startup & Investment

Continuous Learning_Startup & Investment

Kanalga Telegramโ€™da oโ€˜tish

We journey together through the captivating realms of entrepreneurship, investment, life, and technology. This is my chronicle of exploration, where I capture and share the lessons that shape our world. Join us and let's never stop learning!

Ko'proq ko'rsatish
2 309
Obunachilar
Ma'lumot yo'q24 soatlar
-87 kunlar
-3130 kunlar
Postlar arxiv
๋ฏธ๊ตญ ์ตœ์ดˆ ์ž๋™์ฐจ ํšŒ์‚ฌ: 1895๋…„ Duryea Motor Wagon Company. ์ดํ›„ ์ฆ๊ฐ€ ์ถ”์„ธ: 1900๋…„ ์ „๊นŒ์ง€ 34๊ฐœ, 19001909๋…„ 233๊ฐœ, 19101919๋…„ 168๊ฐœ์˜ ์‹ ๊ทœ ์—…์ฒด ์„ค๋ฆฝ. ํ•˜์ง€๋งŒ 1920๋…„๋Œ€ ์ดํ›„ ๊ธ‰๊ฒฉํžˆ consolidation(ํ†ตํํ•ฉ)๋˜๋ฉด์„œ, **โ€˜๋น…3โ€™(GM, ํฌ๋“œ, ํฌ๋ผ์ด์Šฌ๋Ÿฌ)**๊ฐ€ ์‹œ์žฅ์„ ์žฅ์•…. ํ•ต์‹ฌ ํฌ์ธํŠธ: โ€œ์ƒˆ ์ž๋™์ฐจ ํšŒ์‚ฌโ€ ์ถœํ˜„ ์ž์ฒด๋Š” ์ค„์—ˆ์ง€๋งŒ, ๊ทธ ํ›„์—๋„ ์ž๋™์ฐจ๊ฐ€ ์ดˆ๋ž˜ํ•œ ์‚ฌํšŒ์  ๋ณ€ํ™”(๊ต์™ธ ํ™•์‚ฐ, ๋น…๋ฐ•์Šค ๋ฆฌํ…Œ์ผ, ๊ตํ†ต๋ฌธํ™” ๋“ฑ)๋Š” ํ›จ์”ฌ ์ปค์ง. ์ฆ‰, โ€œ์‚ฐ์—…์ด ์„ฑ์ˆ™๋˜๊ณ  ํ˜์‹  ๊ธฐ์—… ์„ค๋ฆฝ์ด ์ค„์–ด๋“ ๋‹คโ€ ํ•ด์„œ ์ž๋™์ฐจ ์ž์ฒด์˜ ์˜ํ–ฅ๋ ฅ์ด ์ค„์–ด๋“œ๋Š” ๊ฑด ์•„๋‹ˆ์—ˆ๋‹ค.

OpenAI์˜ Operator ๊ฐ™์€ ํ”„๋กœ์ ํŠธ๋Š” ๋””์ง€ํ„ธ ์„ธ๊ณ„์—์„œ ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡์ด ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„์—์„œ ํ•˜๋Š” ์—ญํ• ๊ณผ ์œ ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์ธ๊ฐ„์„ ์œ„ํ•ด ์„ค๊ณ„๋œ ์ž…์ถœ๋ ฅ ์ธํ„ฐํŽ˜์ด์Šค(I/O interface)(์˜ˆ: ๋ชจ๋‹ˆํ„ฐ, ํ‚ค๋ณด๋“œ, ๋งˆ์šฐ์Šค ๋˜๋Š” ์ธ๊ฐ„์˜ ์‹ ์ฒด)๋ฅผ ํ†ตํ•ด ์ ์ง„์ ์œผ๋กœ ๋ฒ”์šฉ์ ์ธ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋ฐ˜์ ์ธ ์„ค์ •์„ ๊ฐ–์ถ˜ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ์ด ๋„์ž…๋˜๋ฉด ์ ์ง„์ ์œผ๋กœ ํ˜ผํ•ฉ๋œ ์ž์œจ์„ฑ(mixed autonomy) ์„ธ๊ณ„๊ฐ€ ํ˜•์„ฑ๋˜๋ฉฐ, ์ธ๊ฐ„์€ **ํ•˜์œ„ ์ˆ˜์ค€ ์ž๋™ํ™”(low-level automation)**์˜ ์ƒ์œ„ ๊ฐ๋…์ž(high-level supervisor) ์—ญํ• ์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋งˆ์น˜ ์šด์ „์ž๊ฐ€ ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ(Autopilot)์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•œ ๊ตฌ์กฐ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณ€ํ™”๋Š” ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„๋ณด๋‹ค ๋””์ง€ํ„ธ ์„ธ๊ณ„์—์„œ ํ›จ์”ฌ ๋” ๋น ๋ฅด๊ฒŒ ์ง„ํ–‰๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ ์ด์œ ๋Š” ๋น„ํŠธ๋ฅผ ์ „ํ™˜(flipping bits)ํ•˜๋Š” ๊ฒƒ์ด ์›์ž(atom)๋ฅผ ์ด๋™์‹œํ‚ค๋Š” ๊ฒƒ๋ณด๋‹ค ์•ฝ 1000๋ฐฐ ์ €๋ ดํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์‹œ์žฅ ๊ทœ๋ชจ ๋ฐ ๊ธฐํšŒ๋Š” ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„์—์„œ ํ›จ์”ฌ ๋” ํฌ๋‹ค๊ณ  ๋А๊ปด์ง‘๋‹ˆ๋‹ค. OpenAI ์ดˆ์ฐฝ๊ธฐ ์‹œ์ ˆ, ์šฐ๋ฆฌ๋Š” ์ด๋ฏธ ์ด ์•„์ด๋””์–ด๋ฅผ ์—ฐ๊ตฌํ•œ ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. (์˜ˆ: Universe ๋ฐ World of Bits ํ”„๋กœ์ ํŠธ) ํ•˜์ง€๋งŒ ๊ทธ๋•Œ๋Š” ์ž˜๋ชป๋œ ์ˆœ์„œ๋กœ ์ง„ํ–‰๋˜์—ˆ๊ณ , **๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)**์ด ๋จผ์ € ๋“ฑ์žฅํ•ด์•ผ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์†”์งํžˆ ๋งํ•ด, ์ง€๊ธˆ๋„ ์ด ๊ฐœ๋…์ด ์™„์ „ํžˆ ์ค€๋น„๋˜์—ˆ๋Š”์ง€ 100% ํ™•์‹ ํ•  ์ˆ˜๋Š” ์—†์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, **๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ(Multimodal: ์ด๋ฏธ์ง€, ์˜์ƒ, ์˜ค๋””์˜ค ๋“ฑ)**์ด ์ง€๋‚œ 1~2๋…„๊ฐ„ LLM๊ณผ ํ†ตํ•ฉ๋˜์—ˆ์ง€๋งŒ, ๋Œ€๋ถ€๋ถ„ ์–ด๋Œ‘ํ„ฐ(adapter) ๋ฐฉ์‹์œผ๋กœ ์–ต์ง€๋กœ ๋ถ™์—ฌ์ง„ ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค. ๋” ๋‚˜์œ ์ ์€, ์šฐ๋ฆฌ๋Š” ์•„์ง **๋งค์šฐ ๊ธด ์ž‘์—… ์ฃผ๊ธฐ(very long task horizon)**๋ฅผ ๋‹ค๋ฃฌ ๊ฒฝํ—˜์ด ์—†์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋น„๋””์˜ค๋Š” ์—„์ฒญ๋‚œ ์–‘์˜ ์ •๋ณด๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ํ˜„์žฌ์˜ ๋งฅ๋ฝ ์ฐฝ(context window) ๊ฐœ๋…๋งŒ์œผ๋กœ ๋ชจ๋“  ์ •๋ณด๋ฅผ ์ €์žฅํ•˜๊ณ  ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์„์ง€ ํ™•์‹ ์ด ์—†์Šต๋‹ˆ๋‹ค. ์•„๋งˆ๋„ ์—ฌ๊ธฐ์—์„œ ํ•œ๋‘ ๊ฐ€์ง€ ํ˜์‹ ์ ์ธ ๋ŒํŒŒ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋ฉ๋‹ˆ๋‹ค. ๋‚ด ํƒ€์ž„๋ผ์ธ์—์„œ๋Š” ์‚ฌ๋žŒ๋“ค์ด **โ€œ2025๋…„์ด ์—์ด์ „ํŠธ(agent)์˜ ํ•ดโ€**๊ฐ€ ๋  ๊ฒƒ์ด๋ผ๊ณ  ์ด์•ผ๊ธฐํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ฐœ์ธ์ ์œผ๋กœ๋Š” 2025~2035๋…„์ด โ€˜์—์ด์ „ํŠธ์˜ 10๋…„โ€™์ด ๋  ๊ฒƒ์ด๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ด ๊ฐœ๋…์„ ํ˜„์‹ค์—์„œ ์ž‘๋™ํ•˜๊ฒŒ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋ฐฉ๋Œ€ํ•œ ์—ฐ๊ตฌ ๋ฐ ๊ฐœ๋ฐœ ์ž‘์—…์ด ํ•„์š”ํ•˜์ง€๋งŒ, ๊ถ๊ทน์ ์œผ๋กœ๋Š” ๊ฐ€๋Šฅํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ค๋Š˜๋‚ , OpenAI์˜ Operator๋Š” DoorDash์—์„œ ์ ์‹ฌ์„ ์ฐพ์•„์ฃผ๊ฑฐ๋‚˜, ํ˜ธํ…”์„ ์˜ˆ์•ฝํ•˜๋Š” ๊ฒƒ ์ •๋„๋ฅผ ๋•Œ๋•Œ๋กœ, ํ˜น์€ ๊ฐ„์‹ ํžˆ ํ•ด๋‚ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‚ด์ผ, ์šฐ๋ฆฌ๋Š” Operator ์—์ด์ „ํŠธ๋ฅผ ์—ฌ๋Ÿฌ ๊ฐœ ์กฐ์งํ™”ํ•˜์—ฌ ์žฅ๊ธฐ์ ์ธ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. (์˜ˆ: ํ•˜๋‚˜์˜ ํšŒ์‚ฌ ์ „์ฒด๋ฅผ ์šด์˜ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ๋ณต์žกํ•œ ์ž‘์—…) ๋‹น์‹ ์€ CEO๊ฐ€ ๋˜์–ด ํ•œ ๋ฒˆ์— 10๊ฐœ์˜ Operator๋ฅผ ๊ฐ๋…ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๋•Œ๋•Œ๋กœ ์ง์ ‘ ๊ฐœ์ž…ํ•˜์—ฌ ๋ฌธ์ œ๊ฐ€ ๋˜๋Š” ๋ถ€๋ถ„์„ ํ•ด๊ฒฐํ•˜๊ณ , ์ „๋ฐ˜์ ์ธ ์šด์˜์„ ์กฐ์œจํ•˜๋Š” ๋ฐฉ์‹์ด ๋  ์ˆ˜๋„ ์žˆ๊ฒ ์ฃ . ๊ทธ๋ ‡๊ฒŒ ๋˜๋ฉด ๊ต‰์žฅํžˆ ํฅ๋ฏธ๋กœ์šด ๋ฏธ๋ž˜๊ฐ€ ํŽผ์ณ์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค. https://x.com/karpathy/status/1882544526033924438?s=46&t=h5Byg6Wosg8MJb4pbPSDow

๋”ฅ๋Ÿฌ๋‹์€ ๊ทธ ์–ด๋–ค AI ์•Œ๊ณ ๋ฆฌ์ฆ˜๋ณด๋‹ค๋„ ์ „๋ก€ ์—†์ด ์—„์ฒญ๋‚œ ์—ฐ์‚ฐ๋ ฅ์„ ์š”๊ตฌํ•˜๋Š”, ์ „์„ค์ ์ธ ํƒ์š•์„ ๊ฐ€์ง„ ์กด์žฌ๋ผ๊ณ  ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•ญ์ƒ ์ด๋ฅผ 100% ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์€ ์•„๋‹ ์ˆ˜๋„ ์žˆ์ง€๋งŒ, ์žฅ๊ธฐ์ ์œผ๋กœ ๋‹ฌ์„ฑ ๊ฐ€๋Šฅํ•œ ์ง€๋Šฅ์˜ ์ƒํ•œ์„ ์ด ์—ฐ์‚ฐ๋ ฅ(compute)์— ์˜ํ•ด ๊ฒฐ์ •๋œ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋ฉฐ, ์ด์— ๋ฐ˜ํ•˜๋Š” ๋‚ด๊ธฐ๋ฅผ ํ•˜์ง€๋Š” ์•Š์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ˆœํžˆ ๊ฐœ๋ณ„์ ์ธ ์ตœ์ข… ํ›ˆ๋ จ ๊ณผ์ •์—์„œ๋งŒ์ด ์•„๋‹ˆ๋ผ, ๋ชจ๋“  ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ˜์‹ ์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ๋ณด์ด์ง€ ์•Š๋Š” ํ˜์‹  ๋ฐ ์‹คํ—˜ ์—”์ง„ ์ „์ฒด์—๋„ ํ•ด๋‹น๋ฉ๋‹ˆ๋‹ค. ์ „ํ†ต์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋Š” ์—ฐ์‚ฐ๋ ฅ๊ณผ ๋ณ„๊ฐœ์˜ ์š”์†Œ๋กœ ๊ฐ„์ฃผ๋˜์–ด ์™”์ง€๋งŒ, ์‹ค์ƒ ๋ฐ์ดํ„ฐ๋„ ์ƒ๋‹น ๋ถ€๋ถ„ ์—ฐ์‚ฐ๋ ฅ์˜ ์‚ฐ๋ฌผ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์—ฐ์‚ฐ๋ ฅ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๊ฒƒ๋„ ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์ด์š”. ์ด๋ฅผ โ€œํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ(synthetic data generation)โ€œ์ด๋ผ๊ณ  ๋ถ€๋ฅด์ง€๋งŒ, ์‚ฌ์‹ค โ€œํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ƒ์„ฑโ€๊ณผ โ€œ๊ฐ•ํ™”ํ•™์Šต(reinforcement learning)โ€ ์‚ฌ์ด์—๋Š” ๋งค์šฐ ๊นŠ์€ ์—ฐ๊ด€์„ฑ(์‹ฌ์ง€์–ด ๋™๋“ฑ์„ฑ)์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ๊ฐ•ํ™”ํ•™์Šต์—์„œ ์‹œํ–‰์ฐฉ์˜ค(trial-and-error)๋ฅผ ํ†ตํ•œ ํ•™์Šต ๊ณผ์ •์—์„œ โ€œ์‹œํ–‰(trial)โ€œ์€ ๋ชจ๋ธ์ด ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •์ด๋ฉฐ, โ€œ์˜ค๋ฅ˜(error)โ€ ๋˜๋Š” ๋ณด์ƒ(reward)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ์ด ๋‹ค์‹œ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋Œ€๋กœ, ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ ํ›„ ์ด๋ฅผ ๋žญํ‚นํ•˜๊ฑฐ๋‚˜ ํ•„ํ„ฐ๋งํ•˜๋Š” ๊ณผ์ •์€ 0-1 ์ด์  ํ•จ์ˆ˜(advantage function)์™€ ์‚ฌ์‹ค์ƒ ๋™์ผํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์ถ•ํ•˜ํ•ฉ๋‹ˆ๋‹ค! ์—ฌ๋Ÿฌ๋ถ„์€ ์ง€๊ธˆ ํ˜•ํŽธ์—†๋Š”(?) ๊ฐ•ํ™”ํ•™์Šต์„ ํ•˜๊ณ  ๊ณ„์‹  ๊ฒ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ ํ•˜๋‚˜ ๋”. ์ด๊ฒŒ ๋ช…ํ™•ํ•œ ์‚ฌ์‹ค์ธ์ง€ ๋ชจ๋ฅด๊ฒ ์ง€๋งŒ, ์ธ๊ฐ„ ์•„์ด๋“ค์˜ ํ•™์Šต ๋ฐฉ์‹๊ณผ ๋”ฅ๋Ÿฌ๋‹์˜ ํ•™์Šต ๋ฐฉ์‹์—๋Š” ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ์œ ํ˜•์ด ์žˆ์Šต๋‹ˆ๋‹ค. 1. ๋ชจ๋ฐฉ ํ•™์Šต(Imitation Learning) โ€“ ๋ณด๊ณ  ๋”ฐ๋ผ ํ•˜๊ธฐ (์ฆ‰, ์‚ฌ์ „ ํ›ˆ๋ จ(pretraining)๊ณผ ์ง€๋„ ํ•™์Šต์„ ํ†ตํ•œ ํŒŒ์ธํŠœ๋‹) 2. ์‹œํ–‰์ฐฉ์˜ค ํ•™์Šต(Trial-and-Error Learning) โ€“ ๊ฐ•ํ™”ํ•™์Šต (Reinforcement Learning) ๋‚ด๊ฐ€ ๊ฐ€์žฅ ์ข‹์•„ํ•˜๋Š” ๋‹จ์ˆœํ•œ ์˜ˆ์‹œ๋Š” **์•ŒํŒŒ๊ณ (AlphaGo)**์ž…๋‹ˆ๋‹ค. 1. ์•ŒํŒŒ๊ณ ๋Š” ๋จผ์ € ์ „๋ฌธ๊ฐ€๋“ค์˜ ํ”Œ๋ ˆ์ด๋ฅผ ๋ชจ๋ฐฉํ•˜๋ฉด์„œ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. 2. ์ดํ›„์—๋Š” ๊ฐ•ํ™”ํ•™์Šต์„ ํ†ตํ•ด ์Šค์Šค๋กœ ๊ฒŒ์ž„์—์„œ ์ด๊ธฐ๋Š” ๋ฒ•์„ ๋ฐฐ์›๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋”ฅ๋Ÿฌ๋‹์—์„œ ๋‚˜์˜จ ๊ฑฐ์˜ ๋ชจ๋“  ์ถฉ๊ฒฉ์ ์ธ ๊ฒฐ๊ณผ๋“ค, ์ฆ‰ ๋งˆ๋ฒ• ๊ฐ™์€ ์ˆœ๊ฐ„๋“ค์˜ ์›์ฒœ์€ ํ•ญ์ƒ **2๋ฒˆ(๊ฐ•ํ™”ํ•™์Šต)**์—์„œ ๋‚˜์˜ต๋‹ˆ๋‹ค. 2๋ฒˆ์ด ํ›จ์”ฌ ๋” ๊ฐ•๋ ฅํ•ฉ๋‹ˆ๋‹ค. 2๋ฒˆ์ด ๋ฐ”๋กœ ์šฐ๋ฆฌ๋ฅผ ๋†€๋ผ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. 2๋ฒˆ์ด ์šฐ๋ฆฌ๊ฐ€ โ€œ๋ธŒ๋ ˆ์ดํฌ์•„์›ƒ(Breakout)โ€ ๊ฒŒ์ž„์—์„œ ๊ณต์„ ๋ธ”๋ก ๋’ค์ชฝ์œผ๋กœ ํŠ•๊ฒจ ์ ์ˆ˜๋ฅผ ์–ป๋Š” ์ „๋žต์„ ๋ฐœ๊ฒฌํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ์›๋ฆฌ์ž…๋‹ˆ๋‹ค. 2๋ฒˆ์ด ์•ŒํŒŒ๊ณ ๊ฐ€ ์ด์„ธ๋Œ์„ ์ด๊ธธ ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“  ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  2๋ฒˆ์ด ๋ฐ”๋กœ DeepSeek์ด๋‚˜ o1 ๊ฐ™์€ ๋ชจ๋ธ์ด ์ž์‹ ์˜ ๊ฐ€์ •์„ ์žฌํ‰๊ฐ€ํ•˜๊ณ , ํ›„ํ‡ดํ•˜๊ณ , ๋‹ค๋ฅธ ์ „๋žต์„ ์‹œ๋„ํ•˜๋Š” ๊ฒƒ์ด ํšจ๊ณผ์ ์ด๋ผ๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ•˜๋Š” ์ˆœ๊ฐ„์ž…๋‹ˆ๋‹ค. ์ฆ‰, 2๋ฒˆ์€ ์ด ๋ชจ๋ธ์ด ์ฒด์ธ ์˜ค๋ธŒ ์˜ํŠธ(Chain of Thought) ๋ฐฉ์‹์œผ๋กœ ๋ฌธ์ œ ํ•ด๊ฒฐ ์ „๋žต์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ์ƒ๊ฐ์„ ๊ต์ฐจํ•˜๋ฉฐ ๊ณ ๋ฏผํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด๋Ÿฐ ์‚ฌ๊ณ  ๊ณผ์ •์€ *์ž์—ฐ์ ์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” ํ˜„์ƒ(emergent phenomenon)*์ด๋ฉฐ, ์ด๋Š” ์ •๋ง ๋†€๋ž๊ณ  ์ธ์ƒ์ ์ด๋ฉฐ, ๊ณต๊ณต ์˜์—ญ์—์„œ ๋ฌธ์„œํ™”๋œ ํ˜•ํƒœ๋กœ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” ์™„์ „ํžˆ ์ƒˆ๋กœ์šด ๊ฐœ๋…์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‚ฌ๊ณ  ๋ฐฉ์‹์„ 1๋ฒˆ(๋ชจ๋ฐฉ ํ•™์Šต)์œผ๋กœ๋Š” ๊ฒฐ์ฝ” ๋ฐฐ์šธ ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด ๋ชจ๋ธ์˜ ์ธ์ง€ ๋ฐฉ์‹๊ณผ ์ธ๊ฐ„ ๋ฐ์ดํ„ฐ ๋ผ๋ฒจ๋Ÿฌ์˜ ์ธ์ง€ ๋ฐฉ์‹์€ ๋‹ค๋ฅด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ธ๊ฐ„์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ ์ „๋žต์„ ์ •ํ™•ํ•˜๊ฒŒ ์ฃผ์„ ๋‹ฌ๊ฑฐ๋‚˜, ๊ทธ ์ „๋žต์ด ์–ด๋–ป๊ฒŒ ๋ณด์ด๋Š”์ง€์กฐ์ฐจ ์ •์˜ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์ด๋Ÿฌํ•œ ์ „๋žต๋“ค์€ ๊ฐ•ํ™”ํ•™์Šต์„ ๊ฑฐ์น˜๋Š” ๊ณผ์ •์—์„œ ๊ฒฝํ—˜์ ์œผ๋กœ, ๊ทธ๋ฆฌ๊ณ  ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์šฉํ•œ ๊ฒƒ์œผ๋กœ ๋ฐœ๊ฒฌ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. (์ง„์งœ ๋งˆ์ง€๋ง‰ ์ฐธ๊ณ  ์‚ฌํ•ญ: ๊ฐ•ํ™”ํ•™์Šต(RL)์€ ๊ฐ•๋ ฅํ•˜์ง€๋งŒ, **๊ฐ•ํ™”ํ•™์Šต์„ ํ™œ์šฉํ•œ ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ(RLHF)**์€ ๊ทธ๋ ‡์ง€ ์•Š์Šต๋‹ˆ๋‹ค. RLHF๋Š” RL์ด ์•„๋‹™๋‹ˆ๋‹ค. ์ด์— ๋Œ€ํ•œ ๋ณ„๋„์˜ ๊ธด ๋ถˆ๋งŒ์ด ์ด์ „ ํŠธ์œ—์— ์žˆ์Šต๋‹ˆ๋‹ค.) https://x.com/karpathy/status/1883941452738355376?s=46&t=h5Byg6Wosg8MJb4pbPSDow

์˜คํ”ˆ ์›”๋“œ ์˜์—ญ์—์„œ ์ด์™€ ์œ ์‚ฌํ•œ ๊ฒƒ์˜ ์ฒซ ๋ฒˆ์งธ ์ดˆ๊ธฐ ๋ชจ์Šต์„ ๋ณด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ์ˆ˜ํ•™/์ฝ”๋“œ ๋“ฑ์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ณผ์ •์—์„œ ์ธ๊ฐ„์˜ ๋‚ด์  ๋…๋ฐฑ๊ณผ ์œ ์‚ฌํ•œ ์ „๋žต์„ ๋ฐœ๊ฒฌํ•˜๋Š”๋ฐ, ์ด๋Š” ๋ชจ๋ธ์— ์ง์ ‘ ํ”„๋กœ๊ทธ๋ž˜๋ฐํ•˜๊ธฐ๋Š” ๋งค์šฐ ์–ด๋ ต๊ณ (/๋ถˆ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค) ๋ถˆ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์ €๋Š” ์ด๋ฅผ '์ธ์ง€ ์ „๋žต'์ด๋ผ๊ณ  ๋ถ€๋ฅด๋Š”๋ฐ, ๋‹ค์–‘ํ•œ ๊ฐ๋„์—์„œ ๋ฌธ์ œ ์ ‘๊ทผํ•˜๊ธฐ, ๋‹ค์–‘ํ•œ ์•„์ด๋””์–ด ์‹œ๋„ํ•˜๊ธฐ, ์œ ์ถ” ์ฐพ๊ธฐ, ์—ญ์ถ”์ ํ•˜๊ธฐ, ์žฌ๊ฒ€ํ† ํ•˜๊ธฐ ๋“ฑ์ด ์ด์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ด์ƒํ•˜๊ฒŒ ๋“ค๋ฆฌ๊ฒ ์ง€๋งŒ, LLM์ด ๋” ๋‚˜์€ ์‚ฌ๊ณ  ๋ฐฉ์‹, ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐฉ์‹, ์—ฌ๋Ÿฌ ๋ถ„์•ผ์˜ ์•„์ด๋””์–ด๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐฉ์‹์„ ๋ฐœ๊ฒฌํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์€ ๊ทธ๋Ÿด๋“ฏํ•œ ์ผ์ด๋ฉฐ, ๋Œ์ด์ผœ๋ณด๋ฉด ๋†€๋ž๊ณ  ๋‹นํ™ฉ์Šค๋Ÿฝ์ง€๋งŒ ์ฐฝ์˜์ ์ด๊ณ  ๊ธฐ๋ฐœํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ทธ๋ ‡๊ฒŒ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ตœ์ ํ™”๊ฐ€ ์šฐ๋ฆฌ๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์—†์ง€๋งŒ ๋ฌธ์ œ ํ•ด๊ฒฐ์— ๋” ํšจ์œจ์ ์ด๊ฑฐ๋‚˜ ํšจ๊ณผ์ ์ธ ์ž์‹ ๋งŒ์˜ ์–ธ์–ด๋ฅผ ๋ฐœ๋ช…ํ•˜๋Š” ๊ฒƒ์€ ๊ทธ๋Ÿด๋“ฏํ•œ ์ผ์ž…๋‹ˆ๋‹ค(์ž˜ ์ˆ˜ํ–‰๋œ๋‹ค๋ฉด ๊ทธ๋Ÿด ๊ฐ€๋Šฅ์„ฑ๋„ ์žˆ์Šต๋‹ˆ๋‹ค). ๊ฐ•ํ™” ํ•™์Šต์˜ ๊ธฐ๋ฌ˜ํ•จ์€ ์›์น™์ ์œผ๋กœ ํ•œ๊ณ„๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค. ์•„์ง ๋ฌด๋ธŒ 37์— ์ƒ์‘ํ•˜๋Š” ๊ธฐ์ˆ ์„ ๋ณธ ์ ์ด ์—†๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์–ด๋–ค ๋ชจ์Šต์ผ์ง€ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค. ์•„์ง์€ ์ดˆ๊ธฐ ๋‹จ๊ณ„์ด๊ณ  ์—”์ง€๋‹ˆ์–ด๋ง๊ณผ ์—ฐ๊ตฌ ์ธก๋ฉด์—์„œ ์•ž์œผ๋กœ ํ•ด์•ผ ํ•  ์ผ์ด ๋งŽ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ธฐ์ˆ ์ด ์ด๋ฅผ ์ฐพ์•„๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ถค๋„์— ์˜ค๋ฅธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. https://x.com/karpathy/status/1884336943321997800?s=46&t=h5Byg6Wosg8MJb4pbPSDow

1. ํ•œ๊ตญ๋„ ์ง€๊ธˆ ์ด๋Ÿฐ ๋ชจ๋ธ์„ ๊ณต๊ฐœํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํ™ฉ์ด์—ˆ๋‹ค๋ฉด. 2. Compute Multiplier์˜ ๋ฐœ๊ฒฌ์ด ์ด์ œ ๋งŽ์€ ์ˆ˜์˜ GPU๊ฐ€ ํ•„์š”ํ•˜์ง€ ์•Š๋‹ค๋Š” ๋ฐœ์ƒ์œผ๋กœ ์ด์–ด์งˆ ์ค„์€ ๋ชฐ๋ž๋‹ค. ๊ทธ๋Ÿฐ ์˜๋ฏธ๊ฐ€ ์•„๋‹ˆ๋ผ๊ณ  ๋งํ•˜๊ณ  ์‹ถ์€ ์ถฉ๋™์ด ๋“ค์ง€๋งŒ ๊ทธ๊ฒŒ ๋”ฑํžˆ ์˜๋ฏธ๊ฐ€ ์žˆ์„๊นŒ ์‹ถ๋‹ค. 3. ์ „๊ธฐ์„ธ์˜ ์ฐจ์ด๋ฅผ ๊ณ ๋ คํ•˜๋”๋ผ๋„ ๋ฏธ๊ตญ์ชฝ LLM API ๊ฐ€๊ฒฉ์—๋Š” ๋งˆ์ง„์ด ๊ฝค ๋ถ™์–ด์žˆ์„ ๊ฒƒ์ด๋ผ๋Š” ์ƒ๊ฐ. ์ค‘๊ตญ ๋‚ด์—์„œ ๊ฐ€๊ฒฉ ๊ฒฝ์Ÿ์ด ๋ถ™์€ ๊ฒƒ์ฒ˜๋Ÿผ LLM API ๊ฐ€๊ฒฉ์˜ ์••์ฐฉ์ด ์ผ์–ด๋‚ ์ง€๋„. 4. AI/MLํŒ์˜ ํŒจํ„ด ํ•˜๋‚˜. ๋ฐœ์ „ ์†๋„๊ฐ€ ์›Œ๋‚™ ๋น ๋ฅด๋‹ค๋ณด๋‹ˆ ํŠน์ • ์‹œ์ ์˜ ๊ธฐ์ˆ ๋กœ ์ˆ˜์ต ์ฐฝ์ถœ์„ ์‹œ๋„ํ•˜๋ฉด ์ฐฝ์ถœ์„ ์•ž๋‘˜ ๋•Œ ์ •๋„์— ์ด๋ฏธ ๋‹ค์Œ ์‹œ์ ์˜ ๊ธฐ์ˆ ์ด ์ด์ „ ๊ธฐ์ˆ ์„ ์“ธ๋ชจ ์—†๊ฒŒ ๋งŒ๋“ ๋‹ค. ๋”ฐ๋ผ์„œ - ๋Š˜ ํ•˜๋Š” ์ด์•ผ๊ธฐ์ธ ์ง€๊ธˆ ๊ธฐ์ˆ ์€ ๊ทธ๋ ‡๊ฒŒ ์“ธ๋ชจ ์žˆ์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์— ๋”ํ•ด - ํ˜„์žฌ์˜ ์ˆ˜์ต์— ๊ตฌ์• ๋˜๋Š” ๊ฒƒ์ด ๋ถˆํ•„์š”ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋Š” ์ด์œ . ์–ด์ฉŒ๋ฉด AGI ์ด์ „์— ๊ทธ๋Ÿฐ ๊ฒƒ์— ๊ตฌ์• ๋˜๋Š” ๊ฒƒ์€ ์‹œ๊ฐ„ ๋‚ญ๋น„๋ผ๋Š” ๊ฒƒ์ด ์ข‹์€ ํ†ต์ฐฐ์ผ์ง€๋„. 6. ๋‚˜๋Š” ๊ตณ์ด ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ•˜๋Š” ๊ฒƒ์„ ์„ ํ˜ธํ•˜์ง€๋Š” ์•Š๋Š”๋ฐ, ์–ด์ฐจํ”ผ ์ˆ˜์ต ์ฐฝ์ถœ์ด ์ค‘์š”ํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ๋ฉด ๊ณต๊ฐœ๋ฅผ ํ†ตํ•œ ํ™๋ณด ํšจ๊ณผ๊ฐ€ ๊ฐ€์น˜๊ฐ€ ๋” ํฐ ๊ฒƒ์ด ์•„๋‹๊นŒ ํ•˜๋Š” ์ƒ๊ฐ. 7. ๋‹ค๋“ค MoE๋ฅผ ์™œ ๊ทธ๋ ‡๊ฒŒ ๋ฉ€๋ฆฌํ–ˆ์„๊นŒ ์‹ถ๊ธฐ๋„. ๋ณ„๋กœ ์šฐ์•„ํ•˜์ง€ ์•Š๋‹ค๊ณ  ์ƒ๊ฐํ–ˆ๋Š”์ง€๋„ ๋ชจ๋ฅด๊ฒ ์Œ. (https://x.com/ArmenAgha/status/1883394504981659994) GPU๊ฐ€ ์žˆ๋”๋ผ๋„ GPU๋ฅผ ์•„๊ปด์•ผ ํ•œ๋‹ค๋Š” ๊ตํ›ˆ. 8. ๊ทธ๋Ÿฐ ์˜๋ฏธ์—์„œ ๊ธฐ์กด ์ธํ”„๋ผ๋‚˜ ๋„๊ตฌ์™€์˜ ํ˜ธํ™˜์„ฑ์„ ์œ„ํ•ด ์•„ํ‚คํ…์ฒ˜๋ฅผ ํ‰์ดํ•˜๊ฒŒ ์œ ์ง€ํ•ด์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ์˜ ๋ถˆํ•„์š”ํ•จ์„ ํ™•์ธ. ์„ฑ๋Šฅ ์•ž์—์„œ ๊ทธ๊ฑด ์ค‘์š”ํ•œ ์š”์†Œ๊ฐ€ ์•„๋‹ˆ๋‹ค. ๋‹ค๋“ค ์„ฑ๋Šฅ์ด ์ข‹์€ ๋ชจ๋ธ์„ ์“ฐ๊ณ  ์‹ถ์–ดํ•˜๊ธฐ ๋งˆ๋ จ์ด๋‹ค. Qwen์ด๋‚˜ Mistral๋„ MoE๋ฅผ ๋” ๋ฐ€์–ด๋ถ™์ด์ง€ ์•Š์€ ๊ฒƒ์„ ์ข€ ํ›„ํšŒํ•˜๊ณ  ์žˆ์ง€ ์•Š์„๊นŒ. 9. ํ•˜๋“œ์›จ์–ด๊ฐ€ ์•„๋‹Œ ์†Œํ”„ํŠธ์›จ์–ด์˜ ๊ธฐ์ˆ  ๊ฒฉ์ฐจ๋Š” ์ƒ๊ฐ๋ณด๋‹ค ๋„ˆ๋ฌด๋‚˜ ๋น ๋ฅด๊ฒŒ ์ขํ˜€์งˆ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ ๊ฐ™๋‹ค. ๊ธฐ๋ฐ€์— ๋ถ€์น˜๋”๋ผ๋„ ์ˆœ์‹๊ฐ„์— ๋”ฐ๋ผ์žก์„ ์ˆ˜ ์žˆ๋‹ค. ๊น€์„ฑํ˜„๋‹˜

Box(ํŒŒ์ผ ๊ณต์œ ยทํ˜‘์—… SaaS)์˜ 2014๋…„ S-1(์ƒ์žฅ์‹ ๊ณ ์„œ)๊ณผ ๋Œ€๊ทœ๋ชจ ์ ์ž ์‚ฌ๋ก€: ์ดˆ์ฐฝ๊ธฐ SaaS ๊ธฐ์—…๋“ค์€ โ€œ๊ณ ๊ฐ ์ƒ์• ๊ฐ€์น˜(LTV)๊ฐ€ ์ธ์ž… ๋น„์šฉ(CAC)๋ณด๋‹ค ํ›จ์”ฌ ํฌ๋‹คโ€๋Š” ๋…ผ๋ฆฌ๋กœ ๋Œ€๊ทœ๋ชจ ๋งˆ์ผ€ํŒ…ยท์˜์—… ๋น„์šฉ ์ง€์ถœ โ†’ ์žฅ๊ธฐ์ ์œผ๋กœ ์žฌ๊ตฌ๋…(Recurring) ๋งค์ถœ์ด ํ™•๋ณด๋˜๋ฉด ์ด์ต์ด ์ปค์ง„๋‹ค. ์ด๋กœ ์ธํ•ด IPO ๋‹น์‹œ โ€œ์žฅ๊ธฐ ํˆฌ์ž vs ๋‹จ๊ธฐ ์†์‹คโ€ ๋…ผ์Ÿ์ด ์žˆ์—ˆ์ง€๋งŒ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋งŽ์€ SaaS๊ฐ€ ์œ ์‚ฌํ•œ ๋ชจ๋ธ๋กœ ์„ฑ๊ณต. ํ•„์ž๋Š” ์ด ํ˜„์ƒ์„ โ€œ์‹ค๋ฆฌ์ฝ˜๋ฐธ๋ฆฌ 6๋ฒˆ์งธ ๊ฑฐ์ธ(Silicon Valley Inc.)โ€์ด๋ผ ๋ถ€๋ฆ„(๋‚˜๋จธ์ง€ 5๋Œ€ ๊ฑฐ์ธ์€ ์• ํ”Œ, ์•„๋งˆ์กด, ๊ตฌ๊ธ€, ๋ฉ”ํƒ€, MS). OpenAI o3 ๋ชจ๋ธ์˜ ๋“ฑ์žฅ๊ณผ โ€˜Inference-time Scalingโ€™ o1 ๋ชจ๋ธ(์ด์ „ ์„ธ๋Œ€): ํ•™์Šต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ๊ฐ€ ํฌ๋ฉด ์ •ํ™•๋„๊ฐ€ ๋†’์•„์ง„๋‹ค๋Š” โ€˜ํ•™์Šต ์‹œ ์Šค์ผ€์ผ๋งโ€™๋ฟ ์•„๋‹ˆ๋ผ, โ€œ์ถ”๋ก  ์‹œ ๋” ๋งŽ์€ ์—ฐ์‚ฐ์„ ํ• ๋‹นํ•˜๋ฉด ์ •ํ™•๋„๊ฐ€ ์˜ฌ๋ผ๊ฐ„๋‹คโ€๋Š” ํŠน์„ฑ์ด ๋“ฑ์žฅ. o3 ๋ชจ๋ธ: o1๋ณด๋‹ค ํ›จ์”ฌ ํ–ฅ์ƒ๋œ ๋ฒ„์ „. ํ•„์š”์— ๋”ฐ๋ผ ๋” ๋งŽ์€ GPU ์—ฐ์‚ฐ(์ถ”๋ก  ์‹œ๊ฐ„)์„ ์Ÿ์œผ๋ฉด ๋ฌธ์ œํ•ด๊ฒฐ ์ •ํ™•๋„๊ฐ€ ํฌ๊ฒŒ ์ƒ์Šน(์˜ˆ: ARC ์‹œ๊ฐ ํผ์ฆํ…Œ์ŠคํŠธ์—์„œ ์ธ๊ฐ„ ์ˆ˜์ค€ ์ ‘๊ทผ). ๋‹ค๋งŒ ํ˜„์žฌ๋Š” ๋‹จ๊ฐ€($17~20/ํƒœ์Šคํฌ)๊ฐ€ ๋น„์‹ธ์ง€๋งŒ, ๋น ๋ฅธ ์†๋„๋กœ ๋น„์šฉ์ด ๋‚ด๋ ค๊ฐˆ ์ „๋ง. ์ด โ€œ์ถ”๋ก  ์‹œ ๋Œ€๊ทœ๋ชจ ์—ฐ์‚ฐโ€์€ ๊ธฐ์กด ์˜คํ† ๋ฆฌ๊ทธ๋ ˆ์‹œ๋ธŒ(autoregressive) LLM๊ณผ ๋‹ฌ๋ฆฌ, ์Šค์Šค๋กœ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฐฉ์•ˆ์„ ํƒ์ƒ‰ยท๊ฒ€์ฆ(โ€œ์—ฌ๋Ÿฌ ์ฒด์ธ ์˜ค๋ธŒ ์˜ํŠธ๋ฅผ ์‹œ๋„โ€)ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•จ โ†’ ์‚ฌ๋žŒ์ด ์ง์ ‘ ๊ฒ€์ˆ˜ํ•˜์ง€ ์•Š์•„๋„ ์ž‘์—…์„ ์–ด๋А ์ •๋„ ์™„๊ฒฐ. โ€œAI Ammo(ํƒ„์•ฝ)โ€ vs โ€œBarrel(์ด์—ด)โ€ ๋น„์œ  Keith Rabois๊ฐ€ ์Šคํƒ ํฌ๋“œ ๊ฐ•์—ฐ์—์„œ ๋งํ•œ โ€œ์กฐ์ง์˜ ์†๋„๋Š” โ€˜์ด์—ด(Barrels)โ€™ ์ˆ˜์— ๋‹ฌ๋ฆผ. ๋Œ€๋ถ€๋ถ„ ์ธ์žฌ๋Š” โ€˜ํƒ„์•ฝ(Ammunition)โ€™์— ๊ฐ€๊น๋‹ค.โ€ AI๊ฐ€ ๋ฐœ์ „ํ•˜๋ฉด, **์ˆ˜๋งŽ์€ โ€˜ํƒ„์•ฝ(AI)โ€™**์€ ์ €๋ ดํ•ด์ง€์ง€๋งŒ, โ€˜์ด์—ด(Barrel)โ€™, ์ฆ‰ ํ”„๋กœ์ ํŠธ๋ฅผ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋๊นŒ์ง€ ๋Œ๊ณ  ๊ฐˆ ์กฐ์ง์  ์—ญ๋Ÿ‰์€ ์—ฌ์ „ํžˆ ํฌ์†Œ. AI๊ฐ€ ์Šค์Šค๋กœ ์—…๋ฌด๋ฅผ ์™„์ˆ˜(์–ด์‹œ์Šคํ„ดํŠธ ์•„๋‹Œ ๋…๋ฆฝํ–‰์œ„์ž)ํ•˜๋Š” โ€˜์ธ๋ ฅ ๋Œ€์ฒดโ€™ํ˜•์œผ๋กœ ์ง„ํ™”ํ•˜๋ ค๋ฉด, ๊ธฐ์—… ๊ตฌ์กฐยทํ”„๋กœ์„ธ์Šค๋„ ๊ฑฐ๊ธฐ์— ๋งž์ถฐ์•ผ ํ•˜์ง€๋งŒ, ๊ธฐ์กด ๋Œ€๊ธฐ์—…์€ ๊ทธ๋Ÿฐ ์ „ํ™˜์ด ์‰ฝ์ง€ ์•Š์Œ. ๋ถˆ๊ท ๋“ฑํ•œ(โ€œUnevenโ€) AI ๋„์ž… OpenAI CEO Sam Altman์€ 2025๋…„์— ์ฒซ AI ์—์ด์ „ํŠธ๊ฐ€ ๊ธฐ์—… ์‚ฐ์ถœ๋ฌผ์„ ํฌ๊ฒŒ ๋ฐ”๊ฟ€ ๊ฒƒ์ด๋ผ๊ณ  ์ „๋งํ•˜์ง€๋งŒ, ํ•„์ž๋Š” โ€œ๊ธฐ์กด ๋Œ€๊ธฐ์—…ยท์ „ํ†ต ๊ธฐ์—…(CPG ๋“ฑ)์€ ์ •๋ฐ€ ์ž๋™ํ™” ํ”„๋กœ์„ธ์Šค๊ฐ€ ์ทจ์•ฝ, ๋„์ž…์ด ๋А๋ฆด ๊ฒƒโ€์œผ๋กœ ๋ด„. SaaS๊ฐ€ ๊ธฐ์กด์— โ€œ์ž๋ฆฌ๋ฅผ ์žก์€ ๊ธฐ์—…โ€์„ ์œ„ํ•ด โ€˜์‚ฌ๋žŒ ์ขŒ์„ ๋ผ์ด์„ ์Šคโ€™๋ฅผ ํŒŒ๋Š” ๊ตฌ์กฐ์˜€๋˜ ๊ฒƒ์ฒ˜๋Ÿผ, AI ์‹œ๋Œ€์—๋Š” โ€œ๋ช…ํ™•ํ•œ ํƒœ์Šคํฌ์— ๋Œ€ํ•œ ๊ฐ’ ์ง€๋ถˆโ€๋กœ ์ „ํ™˜๋  ์ˆ˜๋„ ์žˆ์Œ. ํ•˜์ง€๋งŒ ์ด๋Š” ์ฒ˜์Œ๋ถ€ํ„ฐ AI ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์ง„ ์‹ ์ƒ ๊ธฐ์—…์ด ๊ฐ€์žฅ ๋น ๋ฅด๊ฒŒ ์ˆ˜์ตํ™”ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ํผ(์˜ˆ: ๋””์ง€ํ„ธ ๊ด‘๊ณ  ์ดˆ๊ธฐ์—๋„ P&G ๊ฐ™์€ ์ „ํ†ต์ฃผ์ž๋ณด๋‹ค ์‹ ๊ทœ D2C๊ธฐ์—…์ด ๋จผ์ € ์„ฑ์žฅ). ๊ฒฐ๋ก : AI๋Š” ๊ณง ์˜ค์ง€๋งŒ, ๊ธฐ์กด ๋Œ€๊ธฐ์—…์ด ์ด๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๊ธฐ๊นŒ์ง€๋Š” ์‹œ๊ฐ„์ด ๊ฑธ๋ฆด ๊ฒƒ. ํฐ ์กฐ์ง์€ ์˜คํžˆ๋ ค ๋Šฆ๊ณ , ์ƒˆ๋กœ ์‹œ์ž‘ํ•˜๋Š” ํšŒ์‚ฌ์ผ์ˆ˜๋ก AI ์™„์ „ ์ž๋™ํ™”๋ฅผ ๋น ๋ฅด๊ฒŒ ๊ตฌํ˜„ํ•  ์ „๋ง. https://stratechery.com/2025/ais-uneven-arrival/

โ€˜ํ”ฝ&์…”๋ธ”(picks-and-shovels)โ€™๋กœ์„œ์˜ Nvidia ์ƒ์„ฑํ˜• AI ๊ธ‰์„ฑ์žฅ์˜ ์ตœ๋Œ€ ์ˆ˜ํ˜œ์ž๋Š” ํ˜„์žฌ๋Š” Nvidia(GPU ๊ณต๊ธ‰์‚ฌ)์ฒ˜๋Ÿผ ๋ณด์ž„. ๋งŽ์€ ๊ธฐ์—…(Tesla, xAI, Azure, Google Cloud, AWS, Oracle ๋“ฑ)์€ ๋Œ€๊ทœ๋ชจ GPU๋ฅผ ์‚ฌ๋“ค์—ฌ ๊ฐ์ข… AI ๋ชจ๋ธ์„ ์ค€๋น„ ์ค‘. ํ•˜์ง€๋งŒ ๋‹น์žฅ์˜ ์ˆ˜์ต ํšŒ์ˆ˜ ์—ฌ๋ถ€๋Š” ๋ถˆํˆฌ๋ช…. Meta๊ฐ€ ๊ฐ€์žฅ ํ™•์‹คํžˆ โ€œAI ๋น„์šฉ โ†’ ๊ด‘๊ณ ์ˆ˜์ตโ€์„ ์—ฐ๊ฒฐ ์ง€์„ ์ˆ˜ ์žˆ์Œ Meta๋Š” ์ด๋ฏธ ์ž๋™ํ™”๋œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ด‘๊ณ  ์‹œ์Šคํ…œ(โ€œ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋งŒ ์ •์˜ํ•˜๋ฉด, ๋‚˜๋จธ์ง€๋Š” ๋ธ”๋ž™๋ฐ•์Šค์ฒ˜๋Ÿผ Meta๊ฐ€ ์•Œ์•„์„œ ์ตœ์ ํ™”โ€)์„ ์˜ค๋ž˜์ „๋ถ€ํ„ฐ ๊ตฌ์ถ•. iOS ATT(App Tracking Transparency) ์ดํ›„, ํƒ€์‚ฌ๋Š” ๋” ์ •๊ตํ•œ ํƒ€๊ฒŸํŒ…ยทํŠธ๋ž˜ํ‚น์ด ์–ด๋ ค์›Œ์กŒ์ง€๋งŒ, Meta๋Š” ์—„์ฒญ๋‚œ ๋ฐ์ดํ„ฐ์™€ GPU ์ธํ”„๋ผ๋กœ *โ€œํ™•๋ฅ ์  ๊ด‘๊ณ  ํƒ€๊ฒŸํŒ…โ€*์„ ์žฌ๊ตฌ์ถ• โ†’ ๋‹ค๋ฅธ ๊ฒฝ์Ÿ์‚ฌ๊ฐ€ ๋”ฐ๋ผ์˜ค๊ธฐ ์–ด๋ ค์šด ์ˆ˜์ค€. ์—ฌ๊ธฐ์— ์ƒ์„ฑํ˜• AI๋ฅผ ์ด์šฉํ•ด ์ˆ˜๋งŽ์€ ๊ด‘๊ณ  ํฌ๋ฆฌ์—์ดํ‹ฐ๋ธŒ๋ฅผ ์ž๋™ ์ƒ์‚ฐยท์‹คํ—˜ํ•˜๋ฉด, ๊ด‘๊ณ ์ฃผ ์ž…์žฅ์—์„  โ€œ์–ด๋–ป๊ฒŒ ๋งŒ๋“ค์–ด์ง€๋Š”์ง€ ๋ชฐ๋ผ๋„, ๋งค์ถœ์ด ์˜ฌ๋ผ๊ฐ€๋‹ˆ ์“ธ ์ˆ˜๋ฐ–์— ์—†๋Š”โ€ ๊ตฌ์กฐ๊ฐ€ ํ˜•์„ฑ. ์ด๋•Œ Meta๋Š” โ€œ์–ด๋–ค ๊ด‘๊ณ ยทํƒ€๊ฒŸํŒ…์ด ์ž˜๋๋Š”์ง€โ€๋ฅผ ์ž์ฒด์ ์œผ๋กœ ์ถ”์ , ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ๋กœ ์ถ•์  (๊ด‘๊ณ ์ฃผ์—๊ฒ ๋ธ”๋ž™๋ฐ•์Šค). ๋น„์‹ผ ๊ด‘๊ณ  ๋‹จ๊ฐ€๋ฅผ ๋ฐ›๋”๋ผ๋„, ์‹ค์ œ๋กœ ํŒ๋งค์„ฑ๊ณผ๊ฐ€ ์ข‹์œผ๋ฉด ๊ด‘๊ณ ์ฃผ๋„ โ€œ์ด ํ”Œ๋žซํผ์ด ์ œ์ผ ๋‚ซ๋‹คโ€๋ฉฐ ๊ณ„์† ํˆฌ์ž. Meta์˜ โ€˜๊ธ€๋กœ๋ฒŒ ํ”ผ๋“œโ€™ ์ „ํ™˜๊ณผ AI ์ฝ˜ํ…์ธ  ๋ณธ๋ž˜ ํŽ˜์ด์Šค๋ถ์€ ์นœ๊ตฌ/ํŒ”๋กœ์šฐ ๊ธฐ๋ฐ˜์˜ โ€˜์†Œ์…œ ๋„คํŠธ์›Œํฌโ€™์— ์–ฝ๋งค์—ฌ ์žˆ์—ˆ์œผ๋‚˜, ํ‹ฑํ†ก ๊ฒฝ์Ÿ ๋“ฑ์„ ๊ณ„๊ธฐ๋กœ โ€œ์œ ์ € ๋„คํŠธ์›Œํฌ๋ฅผ ๋„˜์–ด์„œ, ์ „ ์„ธ๊ณ„ ๋ชจ๋“  ์ฝ˜ํ…์ธ ๋ฅผ ๊ฐœ์ธํ™”ํ•ด ๋ณด์—ฌ์ฃผ๋Š”โ€ ๋ฐฉํ–ฅ์œผ๋กœ ๋ณ€์‹ (Reels, ์ถ”์ฒœ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐ•ํ™”). ์ด์ œ ๊ทธ ๋‹ค์Œ ๋‹จ๊ณ„๋กœ, โ€œ์‚ฌ์šฉ์ž๊ฐ€ ์ง์ ‘ ์˜ฌ๋ฆฐ UGC๋ฟ ์•„๋‹ˆ๋ผ, AI๊ฐ€ ์ƒ์„ฑํ•˜๋Š” ๋งž์ถคํ˜• ์ด๋ฏธ์ง€ยท์˜์ƒ์„ ๋Œ€๊ทœ๋ชจ๋กœ ํ”ผ๋“œ์— ๊ณต๊ธ‰โ€ํ•  ๊ฐ€๋Šฅ์„ฑ. ์ด ๊ณผ์ •์—์„œ ๊ธฐ์กด์—๋Š” โ€œ์‚ฌ์šฉ์ž ์‚ฌ์ง„ยท์˜์ƒ โ†’ ๊ด‘๊ณ โ€ ๊ตฌ์กฐ์˜€๋‹ค๋ฉด, ์ด์ œ โ€œAI๋กœ ๋งŒ๋“  ๋ชจ๋“  ์ด๋ฏธ์ง€ยท์˜์ƒ ์ž์ฒด๊ฐ€ ๊ด‘๊ณ ๊ฐ€ ๋  ์ˆ˜๋„ ์žˆ์Œ.โ€ ์ฝ˜ํ…์ธ ์™€ ๊ด‘๊ณ ์˜ ๊ฒฝ๊ณ„๊ฐ€ ํ๋ฆฟํ•ด์ง€๋ฉฐ, **์›ํ•˜๋Š” ์•„์ดํ…œ์„ ์ฆ‰์‹œ โ€˜ํด๋ฆญโ†’๊ตฌ๋งคโ€™**ํ•˜๋Š” ํ˜•ํƒœ๊ฐ€ ๊ฐ€๋Šฅํ•ด์ง. โ€˜์Šค๋งˆ์ผ ์ปค๋ธŒ(Smiling Curve)โ€™์™€ ๋ฌดํ•œ ๊ด‘๊ณ  ์ธ๋ฒคํ† ๋ฆฌ ์ฝ˜ํ…์ธ ๊ฐ€ ๋ฌดํ•œ์ • ์ƒ์„ฑ๋˜๋ฉด, ๊ด‘๊ณ  ์ธ๋ฒคํ† ๋ฆฌ(๋…ธ์ถœ ์ง€๋ฉด) ์—ญ์‹œ ์ด๋ก ์ƒ ๋ฌดํ•œ์— ๊ฐ€๊นŒ์›Œ์ง โ†’ ๊ด‘๊ณ  ๋‹จ๊ฐ€๋Š” ์˜คํžˆ๋ ค ๊ทน๋‹จ์ ์œผ๋กœ ๋‚ฎ์•„์งˆ ์ˆ˜ ์žˆ์Œ. ๊ทธ๋Ÿฐ๋ฐ ๊ทธ ๋‚ฎ์€ ๋‹จ๊ฐ€์กฐ์ฐจ **์ดˆ๋Œ€ํ˜• ํ”Œ๋žซํผ(Meta)**๊ฐ€ ์ „์ฒด๋ฅผ ์žฅ์•…ํ•˜๋ฉด, ์†Œ๊ทœ๋ชจ ๊ฒฝ์Ÿ์ž๋“ค์ด ํŒŒ๊ณ ๋“ค ํ‹ˆ์ด ๋”์šฑ ์ค„์–ด๋“ ๋‹ค. Meta๊ฐ€ โ€œ์‚ฌ์šฉ์ž์ˆ˜+AI ์ธํ”„๋ผ+๋ฐ์ดํ„ฐโ€๋ฅผ ๋ชจ๋‘ ๊ฐ–์ถ˜ ๊ฐ€์žฅ ํฐ Aggregator๊ฐ€ ๋˜์–ด, โ€œ๋ฌดํ•œ ์ฝ˜ํ…์ธ  vs ๋ฌดํ•œ ๊ด‘๊ณ โ€๋ฅผ ์—ฐ๊ฒฐํ•˜๋ฉฐ ๋ง‰๋Œ€ํ•œ ๊ฐ€์น˜๋ฅผ ๋งŒ๋“ค์–ด๋‚ผ ๊ฒƒ. ์žฅ๊ธฐ ์ „๋ง: XR(๊ฐ€์ƒยท์ฆ๊ฐ•ํ˜„์‹ค)๊ณผ โ€˜Generative UIโ€™ 4-1. XR์€ AI๊ฐ€ ๊ฒฐํ•ฉ๋˜์–ด์•ผ ํญ๋ฐœ์ ์œผ๋กœ ์˜๋ฏธ๊ฐ€ ์ƒ๊น€ ๋ฉ”ํƒ€๋ฒ„์Šค/VR/AR ๋“ฑ์€ ๋งŽ์€ ์ด๋“ค์ด ํšŒ์˜์ ์ด์—ˆ์œผ๋‚˜, AI๋กœ ์ธํ•œ โ€œ3D์ฝ˜ํ…์ธ  ์ƒ์„ฑ ๋น„์šฉโ€ ํš๊ธฐ์  ์ ˆ๊ฐ์ด ๊ฐ€๋Šฅํ•ด์ง€๋ฉด, VR ๊ณต๊ฐ„ ์„ค๊ณ„๋„ ํ›จ์”ฌ ์‰ฌ์›Œ์ง(DALL-E๋‚˜ 3D ์ƒ์„ฑ๋ชจ๋ธ ๋“ฑ). AR ๊ธฐ๊ธฐ(์˜ˆ: Meta๊ฐ€ ์ค€๋น„ํ•˜๋Š” Orion)์—์„œ๋„, ์Šค๋งˆํŠธํฐ ์‹์˜ ํ”ฝ์…€ํ™”๋œ UI๋Š” ๋ถˆํŽธ. ๋Œ€์‹  AI๊ฐ€ โ€œ์‚ฌ์šฉ์ž๊ฐ€ ํ•„์š”ํ•  ๋•Œ ํ•„์š”ํ•œ UI๋งŒโ€ ์ฆ‰์„์—์„œ ์ƒ์„ฑํ•ด์ค„ ์ˆ˜ ์žˆ์Œ(Generative UI). ์ด๋กœ์จ AR/VR ๊ธฐ๊ธฐ์˜ ํŽธ์˜์„ฑ๊ณผ ๋ชฐ์ž…๊ฐ์ด ํฌ๊ฒŒ ๋›ฐ์–ด๋‚  ๊ฒƒ์ด๊ณ , ๊ทธ ํ”Œ๋žซํผ์„ Meta๊ฐ€ ์„ ๋„. 4-2. ๊ฒฐ๋ก ์ ์œผ๋กœ โ€œํ˜„์‹ค+๊ฐ€์ƒ ๋ชจ๋“  ๋งฅ๋ฝ์ด ๊ด‘๊ณ  ์ธ๋ฒคํ† ๋ฆฌโ€๊ฐ€ ๋จ ๋ฌผ๋ฆฌ ์„ธ๊ณ„๋“  ๊ฐ€์ƒ ์„ธ๊ณ„๋“ , AI๊ฐ€ ๋ชจ๋“  ์‚ฌ๋ฌผ์„ ์ธ์‹ํ•ด, ๊ฑฐ๊ธฐ์„œ ๊ด‘๊ณ ๋‚˜ ํŒ๋งค ๋งํฌ๋ฅผ ์ž๋™ ์—ฐ๊ฒฐ(โ€œ์ด ๊ณต๊ฐ„์ด๋“  ์ด ์‚ฌ๋ฌผ์ด๋“  ๊ด‘๊ณ ๋กœ์„œ ์ „ํ™˜ ๊ฐ€๋Šฅโ€). AI ์‹œ๋Œ€์˜ โ€œ๋ฌดํ•œํ•œ ํ’์š”(Abundance to Infinity)โ€์—์„œ Meta๊ฐ€ ๊ฐ€์žฅ ํฐ ์ˆ˜ํ˜œ์ž https://stratechery.com/2024/metas-ai-abundance/

๋ฆฌ์•™ ์›ฌํŽ‘: ํ•˜์ดํ”Œ๋ผ์ด์–ด๋ฅผ ํ†ตํ•ด ๊ธฐ์ˆ  ์ค‘์‹ฌ์˜ ํ˜์‹ ์— ๋Œ€ํ•œ ์ž์‹ ๊ฐ์ด ๊ฐ•ํ™”๋œ ์ธก๋ฉด๋„ ์žˆ์ง€๋งŒ, ์ˆœํƒ„ํ•œ ํ•ญํ•ด๋งŒ ์žˆ์—ˆ๋˜ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์˜ค๋žœ ์ถ•์  ๊ณผ์ •์„ ๊ฑฐ์ณค์Šต๋‹ˆ๋‹ค. ์™ธ๋ถ€์—์„œ ๋ณด๋Š” ํ•˜์ดํ”Œ๋ผ์ด์–ด์˜ ๋ชจ์Šต์€ 2015๋…„ ์ดํ›„์˜ ๋ชจ์Šต์ด์ง€๋งŒ, ์‚ฌ์‹ค ์ €ํฌ๋Š” 16๋…„ ๋™์•ˆ ํ•˜์ดํ”Œ๋ผ์ด์–ด๋ฅผ ์šด์˜ํ•ด ์™”์Šต๋‹ˆ๋‹ค. ๋‹ค์‹œ ํ˜์‹ ์ด๋ผ๋Š” ์ฃผ์ œ๋กœ ๋Œ์•„์™€์„œ. ์ด์ œ ๊ฒฝ์ œ๊ฐ€ ์‡ ํ‡ดํ•˜๊ธฐ ์‹œ์ž‘ํ•˜๊ณ  ์ž๋ณธ์ด ๋” ์ด์ƒ ์˜ˆ์ „์ฒ˜๋Ÿผ ๋А์Šจํ•ด์ง€์ง€ ์•Š๋Š”๋ฐ, ์ด๊ฒƒ์ด ๊ธฐ์ดˆ ์—ฐ๊ตฌ๋ฅผ ์–ต์ œํ• ๊นŒ์š”? ๋Ÿ‰์›ํŽ‘: ๋ฐ˜๋“œ์‹œ ๊ทธ๋ ‡๊ฒŒ ์ƒ๊ฐํ•˜์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค. ์ค‘๊ตญ์˜ ์‚ฐ์—… ๊ตฌ์กฐ ์กฐ์ •์€ ํ•„์—ฐ์ ์œผ๋กœ ํ•˜๋“œ์ฝ”์–ด ๊ธฐ์ˆ  ํ˜์‹ ์— ๋” ๋งŽ์ด ์˜์กดํ•˜๊ฒŒ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฌ๋žŒ๋“ค์ด ๊ณผ๊ฑฐ์— ๋น ๋ฅด๊ฒŒ ๋ˆ์„ ๋ฒ„๋Š” ๊ฒƒ์ด ์šด์ด ์ข‹์•„์„œ ๊ฐ€๋Šฅํ–ˆ๋‹ค๋Š” ๊ฒƒ์„ ๊นจ๋‹ซ๊ฒŒ ๋˜๋ฉด ์Šค์Šค๋กœ๋ฅผ ๋‚ฎ์ถ”๊ณ  ์ง„์ •ํ•œ ํ˜์‹ ์— ๋” ๊ธฐ๊บผ์ด ์ฐธ์—ฌํ•˜๊ฒŒ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ์ด๊ฒƒ๋„ ๋‚™๊ด€์ ์ธ๊ฐ€์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ์ €๋Š” 1980๋…„๋Œ€์— ๊ด‘๋‘ฅ์„ฑ์˜ 5์„  ๋„์‹œ์—์„œ ์ž๋ž์Šต๋‹ˆ๋‹ค. ์•„๋ฒ„์ง€๋Š” ์ดˆ๋“ฑํ•™๊ต ๊ต์‚ฌ์˜€์Šต๋‹ˆ๋‹ค. 1990๋…„๋Œ€์—๋Š” ๊ด‘๋‘ฅ์„ฑ์—์„œ ๋ˆ์„ ๋ฒŒ ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ๊ฐ€ ๋งŽ์•˜์Šต๋‹ˆ๋‹ค. ๋‹น์‹œ์—๋Š” ๋งŽ์€ ๋ถ€๋ชจ๋‹˜์ด ์ €ํฌ ์ง‘์— ์˜ค์…จ๋Š”๋ฐ, ๊ธฐ๋ณธ์ ์œผ๋กœ ๊ณต๋ถ€๋Š” ์“ธ๋ชจ์—†๋‹ค๊ณ  ์ƒ๊ฐํ•˜์…จ์ฃ . ํ•˜์ง€๋งŒ ์ง€๊ธˆ ๋Œ์ด์ผœ๋ณด๋ฉด ๋ชจ๋‘ ์ƒ๊ฐ์ด ๋ฐ”๋€Œ์—ˆ์Šต๋‹ˆ๋‹ค. ๋” ์ด์ƒ ๋ˆ์„ ๋ฒ„๋Š” ๊ฒƒ์ด ์‰ฝ์ง€ ์•Š๊ณ  ํƒ์‹œ๋ฅผ ์šด์ „ํ•  ๊ธฐํšŒ์กฐ์ฐจ ๊ณง ์‚ฌ๋ผ์งˆ์ง€๋„ ๋ชจ๋ฅด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ํ•œ ์„ธ๋Œ€๋ฐ–์— ๊ฑธ๋ฆฌ์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ์•ž์œผ๋กœ๋Š” ํ•˜๋“œ์ฝ”์–ด ํ˜์‹ ์ด ์ ์  ๋” ๋ณดํŽธํ™”๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฌํšŒ ์ „์ฒด๊ฐ€ ์ด ์ ์— ๋Œ€ํ•ด ๊ต์œก์„ ๋ฐ›์•„์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ง€๊ธˆ ๋‹น์žฅ ์ดํ•ดํ•˜๊ธฐ๋Š” ์‰ฝ์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์‚ฌํšŒ๊ฐ€ ํ•˜๋“œ์ฝ”์–ด ํ˜์‹ ์— ์ „๋…ํ•˜๋Š” ์‚ฌ๋žŒ๋“ค์ด ๋ช…์„ฑ๊ณผ ๋ถ€๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋„๋ก ํ—ˆ์šฉํ•˜๋ฉด ์šฐ๋ฆฌ์˜ ์ง‘๋‹จ์  ์‚ฌ๊ณ ๋ฐฉ์‹๋„ ์ ์‘ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ช‡ ๊ฐ€์ง€ ์˜ˆ์™€ ํ”„๋กœ์„ธ์Šค๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. https://www.chinatalk.media/p/deepseek-ceo-interview-with-chinas

ํ•˜์ง€๋งŒ ๊ธฐ์ˆ  ์ž์ฒด๊ฐ€ ์ •๋ง ํฐ ๊ฒฉ์ฐจ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์„๊นŒ์š”? ๋˜ํ•œ ์ ˆ๋Œ€์ ์ธ ๊ธฐ์ˆ  ๋น„๋ฐ€์€ ์—†๋‹ค๊ณ  ๋ง์”€ํ•˜์…จ์ž–์•„์š”. Liang Wenfeng: ๊ธฐ์ˆ ์—๋Š” ๋น„๋ฐ€์ด ์—†์ง€๋งŒ ๋ณต์ œ๋ฅผ ์œ„ํ•ด์„œ๋Š” ์‹œ๊ฐ„๊ณผ ๋น„์šฉ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ก ์ ์œผ๋กœ ์—”๋น„๋””์•„์˜ ๊ทธ๋ž˜ํ”ฝ ์นด๋“œ๋Š” ๊ธฐ์ˆ ์  ๋น„๋ฐ€์ด ์—†๊ณ  ๋ณต์ œํ•˜๊ธฐ ์‰ฝ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ฒ˜์Œ๋ถ€ํ„ฐ ํŒ€์„ ๊ตฌ์„ฑํ•˜๊ณ  ์ฐจ์„ธ๋Œ€ ๊ธฐ์ˆ ์„ ๋”ฐ๋ผ์žก๋Š” ๋ฐ๋Š” ์‹œ๊ฐ„์ด ๊ฑธ๋ฆฌ๊ธฐ ๋•Œ๋ฌธ์— ์‹ค์ œ ํ•ด์ž๋Š” ์ƒ๋‹นํžˆ ๋„“์Šต๋‹ˆ๋‹ค. ๋‹ค๋ฅธ 6๊ฐœ ๋Œ€ํ˜• ์Šคํƒ€ํŠธ์—…์˜ ์ตœ์ข… ๊ฒŒ์ž„์€ ์–ด๋–ป๊ฒŒ ๋  ๊ฒƒ์œผ๋กœ ๋ณด์‹œ๋‚˜์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ๋‘์„ธ ๊ฐœ๋Š” ์‚ด์•„๋‚จ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ง€๊ธˆ์€ ๋ชจ๋‘ '๋ˆ ๋ฒ„๋Š”' ๋‹จ๊ณ„์— ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ž๊ธฐ ํฌ์ง€์…”๋‹์ด ๋ช…ํ™•ํ•˜๊ณ  ์šด์˜์„ ๋” ์ž˜ ๋‹ค๋“ฌ๋Š” ํšŒ์‚ฌ๊ฐ€ ์‚ด์•„๋‚จ์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ํšŒ์‚ฌ๋“ค์€ ์ƒ๋‹นํ•œ ๋ณ€ํ™”๋ฅผ ๊ฒช์„ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์น˜ ์žˆ๋Š” ๊ฒƒ๋“ค์ด ๋‹จ์ˆœํžˆ ์‚ฌ๋ผ์ง€๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๋‹ค๋ฅธ ํ˜•ํƒœ๋ฅผ ๋ ๊ฒŒ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•˜์ดํ”Œ๋ผ์ด์–ด์˜ ๊ฒฝ์Ÿ์— ๋Œ€ํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์€ ์ˆ˜ํ‰์  ๊ฒฝ์Ÿ์— ๊ฑฐ์˜ ๊ด€์‹ฌ์„ ๊ธฐ์šธ์ด์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— '๋ถˆํˆฌ๋ช…'ํ•˜๋‹ค๊ณ  ๋ฌ˜์‚ฌ๋˜์–ด ์™”์Šต๋‹ˆ๋‹ค. ๊ฒฝ์Ÿ์— ๋Œ€ํ•ด ์ƒ๊ฐํ•  ๋•Œ ์–ด๋–ค ์ถœ๋ฐœ์ ์ด ์žˆ๋‚˜์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ์ œ๊ฐ€ ์ž์ฃผ ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ์€ ์–ด๋–ค ๊ฒƒ์ด ์‚ฌํšŒ ์šด์˜์˜ ํšจ์œจ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ์‚ฐ์—… ์ฒด์ธ ๋‚ด์—์„œ ๊ฐ•์ ์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋Š”์ง€ ์—ฌ๋ถ€์ž…๋‹ˆ๋‹ค. ๊ถ๊ทน์ ์ธ ๋ชฉํ‘œ๊ฐ€ ์‚ฌํšŒ๋ฅผ ๋” ํšจ์œจ์ ์œผ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋ผ๋ฉด ๊ทธ ๋ชฉํ‘œ๋Š” ์œ ํšจํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ์‚ฌ์ด์˜ ๋งŽ์€ ๊ฒƒ๋“ค์€ ์ผ์‹œ์ ์ธ ๋‹จ๊ณ„์— ๋ถˆ๊ณผํ•˜๋ฉฐ, ๊ทธ๊ฒƒ์— ์ง€๋‚˜์น˜๊ฒŒ ์ง‘์ค‘ํ•˜๋ฉด ํ˜ผ๋ž€์„ ์ดˆ๋ž˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. OpenAI์˜ ์ „ ์ •์ฑ… ์ฑ…์ž„์ž์ด์ž Anthropic์˜ ๊ณต๋™ ์ฐฝ๋ฆฝ์ž์ธ ์žญ ํด๋ผํฌ๋Š” DeepSeek๊ฐ€ "์ดํ•ดํ•  ์ˆ˜ ์—†๋Š” ๋งˆ๋ฒ•์‚ฌ"๋“ค์„ ๊ณ ์šฉํ–ˆ๋‹ค๊ณ  ๋งํ–ˆ์Šต๋‹ˆ๋‹ค. ๋”ฅ์„œ์น˜ V2์—๋Š” ์–ด๋–ค ์‚ฌ๋žŒ๋“ค์ด ์ฐธ์—ฌํ–ˆ๋‚˜์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ๋งˆ๋ฒ•์‚ฌ๋Š” ์—†์Šต๋‹ˆ๋‹ค. ์ €ํฌ๋Š” ๋Œ€๋ถ€๋ถ„ ์ผ๋ฅ˜ ๋Œ€ํ•™์„ ๊ฐ“ ์กธ์—…ํ•œ ์‹ ์ž…์ƒ, 4~5๋…„์ฐจ ๋ฐ•์‚ฌ ๊ณผ์ • ํ•™์ƒ, ๋ช‡ ๋…„ ์ „์— ์กธ์—…ํ•œ ์ Š์€์ด๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋งŽ์€ LLM ํšŒ์‚ฌ๊ฐ€ ํ•ด์™ธ ์ธ์žฌ ์ฑ„์šฉ์— ์ง‘์ฐฉํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด ๋ถ„์•ผ์˜ ์ƒ์œ„ 50์œ„๊ถŒ ์ธ์žฌ๋Š” ์ค‘๊ตญ ๊ธฐ์—…์—์„œ ์ผํ•˜์ง€ ์•Š์„ ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ์–˜๊ธฐ๋„ ์ข…์ข… ๋“ค๋ฆฌ์ฃ . ํŒ€์›๋“ค์˜ ์ถœ์‹  ๊ตญ๊ฐ€๋Š” ์–ด๋””์ธ๊ฐ€์š”? Liang Wenfeng: V2 ๋ชจ๋ธ์˜ ํŒ€์› ์ค‘์—๋Š” ํ•ด์™ธ์—์„œ ์ค‘๊ตญ์œผ๋กœ ๋Œ์•„์˜จ ์‚ฌ๋žŒ์€ ์—†์œผ๋ฉฐ ๋ชจ๋‘ ํ˜„์ง€์ธ์ž…๋‹ˆ๋‹ค. ์ƒ์œ„ 50๋ช…์˜ ์ „๋ฌธ๊ฐ€๊ฐ€ ์ค‘๊ตญ์— ์—†์„ ์ˆ˜๋„ ์žˆ์ง€๋งŒ, ๊ทธ๋Ÿฐ ์ธ์žฌ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์ง์ ‘ ์–‘์„ฑํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด MLA ํ˜์‹ ์€ ์–ด๋–ป๊ฒŒ ์‹œ์ž‘๋˜์—ˆ๋‚˜์š”? ํ•œ ์ Š์€ ์—ฐ๊ตฌ์›์˜ ๊ฐœ์ธ์ ์ธ ๊ด€์‹ฌ์—์„œ ์•„์ด๋””์–ด๊ฐ€ ์‹œ์ž‘๋˜์—ˆ๋‹ค๊ณ  ๋“ค์—ˆ๋Š”๋ฐ์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ๊ทธ๋Š” ์ฃผ์˜ ์ง‘์ค‘ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ์ฃผ๋ฅ˜ ์ง„ํ™” ์ถ”์„ธ๋ฅผ ์š”์•ฝํ•œ ํ›„ ๋Œ€์•ˆ์„ ์„ค๊ณ„ํ•ด๋ณด๊ณ  ์‹ถ๋‹ค๋Š” ์ƒ๊ฐ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์•„์ด๋””์–ด๋ฅผ ํ˜„์‹คํ™”ํ•˜๋Š” ๋ฐ๋Š” ์˜ค๋žœ ์‹œ๊ฐ„์ด ๊ฑธ๋ ธ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ํŒ€์„ ๊ตฌ์„ฑํ•˜๊ณ  ๋ช‡ ๋‹ฌ์— ๊ฑธ์ณ ์ž‘์—…์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. [์กฐ๋˜: ์•Œ๋ ‰ ๋ž˜๋“œํฌ๋“œ์˜ GPT ์‹œ๋ฆฌ์ฆˆ ์ดˆ๊ธฐ ๊ธฐ๊ณ ๊ฐ€ ๋– ์˜ค๋ฅด๋ฉฐ, ๊ณผ๊ฑฐ ์ฐจ์ด๋‚˜ํ†ก์—์„œ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ˜์‹ ์€ ๋ฐ˜๋„์ฒด ์ œ์กฐ์™€ ๊ฐ™์€ ๊ธฐ์ˆ  ๋ถ„์•ผ๋ฅผ ๊ฐœ์ฒ™ํ•˜๋Š” ๊ฒƒ๊ณผ๋Š” ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฅด๋‹ค๊ณ  ์ฃผ์žฅํ–ˆ๋˜ ๋…ผ์ง€๋ฅผ ๋– ์˜ฌ๋ฆฌ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ•์‚ฌ ํ•™์œ„์™€ ์ˆ˜๋…„๊ฐ„์˜ ์—…๊ณ„ ๊ฒฝํ—˜์ด ์žˆ์–ด์•ผ๋งŒ ์œ ์šฉํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ •๋ง ์˜ˆ๋ฆฌํ•˜๊ณ  ๊ตถ์ฃผ๋ฆฐ 20๋Œ€(์ค‘๊ตญ์—๋Š” ๋งŽ์€ 20๋Œ€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค!)๊ฐ€ ๋˜๋ฉด ๊ทธ ๊ฒฝ๊ณ„๋ฅผ ๋„“ํž ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. OpenAI์˜ ์ˆ„ํ†  ๋”๊ธ€๋ผ์Šค์™€ Anthropic์˜ ํŠธ๋ ŒํŠผ ๋ธŒ๋ฆฌ์ผ„์ด ์ง„ํ–‰ํ•œ ๋“œ์™€๋ฅด์ผ€์‹œ์™€์˜ ์ธํ„ฐ๋ทฐ๋Š” ์ด๋Ÿฌํ•œ ์—ญ๋™์„ฑ์„ ์ž˜ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. "์™ธ๊ตํ•™ ๋…ผ๋ฌธ์„ ์“ด ๋…ธ์•” ๋ธŒ๋ผ์šด์€ ์ˆ„ํ† ์— ๋Œ€ํ•ด ์ด๋ ‡๊ฒŒ ๋งํ–ˆ์Šต๋‹ˆ๋‹ค: "๊ทธ๋Š” ์ด ๋ถ„์•ผ์— ์ข…์‚ฌํ•œ ์ง€ 1.5๋…„๋ฐ–์— ๋˜์ง€ ์•Š์•˜์ง€๋งŒ, AI ์—…๊ณ„ ์‚ฌ๋žŒ๋“ค์€ ๊ทธ๊ฐ€ ์ œ๋ฏธ๋‹ˆ์˜ ์„ฑ๊ณต์— ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ธ๋ฌผ ์ค‘ ํ•œ ๋ช…์ด๋ผ๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค."]๋กœ ์‹œ์ž‘ํ•˜๋Š” ๋“œ์™€๋ฅด์ผ€์‹œ. ์ด๋Ÿฌํ•œ ๋‹ค์–‘ํ•œ ์‚ฌ๊ณ ์˜ ์ถœํ˜„์€ ํ˜์‹  ์ค‘์‹ฌ์˜ ์กฐ์ง ๊ตฌ์กฐ์™€ ๋ฐ€์ ‘ํ•œ ๊ด€๋ จ์ด ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค. ํ•˜์ดํ”Œ๋ผ์ด์–ด ์‹œ๋Œ€์—๋Š” ํŒ€์—์„œ ๋ชฉํ‘œ๋‚˜ ๊ณผ์ œ๋ฅผ ์œ„์—์„œ ์•„๋ž˜๋กœ ํ• ๋‹นํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๊ฑฐ์˜ ์—†์—ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ AGI๋Š” ๋ถˆํ™•์‹ค์„ฑ์ด ํฐ ๊ฐœ์ฒ™์ง€ ํƒํ—˜์„ ํฌํ•จํ•˜๋Š”๋ฐ, ์ด๋กœ ์ธํ•ด ๊ฒฝ์˜์ง„์˜ ๊ฐœ์ž…์ด ๋” ๋งŽ์•„์กŒ๋‚˜์š”? Liang Wenfeng: DeepSeek๋Š” ์—ฌ์ „ํžˆ ์ „์ ์œผ๋กœ ์ƒํ–ฅ์‹์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์—ญํ• ์„ ๋ฏธ๋ฆฌ ์ •์˜ํ•˜์ง€ ์•Š๊ณ  ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ถ„์—…์ด ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ๋ชจ๋‘๊ฐ€ ๊ฐ์ž์˜ ๊ณ ์œ ํ•œ ์—ฌ์ •์„ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ  ์•„์ด๋””์–ด๋ฅผ ๊ฐ€์ ธ์˜ค๊ธฐ ๋•Œ๋ฌธ์— ๋ˆ„๊ตฌ๋ฅผ ๋ฐ€์–ด๋ถ™์ผ ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค. ํƒ๊ตฌํ•˜๋Š” ๋™์•ˆ ๋ˆ„๊ตฐ๊ฐ€๊ฐ€ ๋ฌธ์ œ๋ฅผ ๋ฐœ๊ฒฌํ•˜๋ฉด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋‹ค๋ฅธ ์‚ฌ๋žŒ๊ณผ ๋…ผ์˜ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์–ด๋–ค ์•„์ด๋””์–ด๊ฐ€ ์ž ์žฌ๋ ฅ์„ ๋ณด์ด๋ฉด ํ•˜ํ–ฅ์‹์œผ๋กœ ๋ฆฌ์†Œ์Šค๋ฅผ ํ• ๋‹นํ•ฉ๋‹ˆ๋‹ค. DeepSeek๋Š” GPU์™€ ์ธ๋ ฅ๊ณผ ๊ฐ™์€ ๋ฆฌ์†Œ์Šค๋ฅผ ๋งค์šฐ ์œ ์—ฐํ•˜๊ฒŒ ๋™์›ํ•œ๋‹ค๊ณ  ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. Liang Wenfeng: ํŒ€์› ๋ˆ„๊ตฌ๋‚˜ ์–ธ์ œ๋“ ์ง€ GPU๋‚˜ ์ธ๋ ฅ์„ ์ด์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์•„์ด๋””์–ด๊ฐ€ ์žˆ๋Š” ์‚ฌ๋žŒ์€ ์Šน์ธ ์—†์ด๋„ ์–ธ์ œ๋“ ์ง€ ํŠธ๋ ˆ์ด๋‹ ํด๋Ÿฌ์Šคํ„ฐ ์นด๋“œ์— ์•ก์„ธ์Šคํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, ๊ณ„์ธต ๊ตฌ์กฐ๋‚˜ ๋ณ„๋„์˜ ๋ถ€์„œ๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ์— ์„œ๋กœ ๊ด€์‹ฌ๋งŒ ์žˆ๋‹ค๋ฉด ํŒ€์›๋“ค ๊ฐ„์— ํ˜‘์—…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋А์Šจํ•œ ๊ฒฝ์˜ ์Šคํƒ€์ผ์€ ์ž๊ธฐ ์ฃผ๋„์„ฑ์ด ๋†’์€ ์ธ์žฌ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๋ฐ ์˜์กดํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด๊ณผ๋Š” ๋‹ค๋ฅธ ํ‰๊ฐ€ ๊ธฐ์ค€์„ ํ†ตํ•ด ๋›ฐ์–ด๋‚œ ์ธ์žฌ๋ฅผ ๋ฐœ๊ตดํ•˜๋Š” ๋ฐ ํƒ์›”ํ•˜๋‹ค๊ณ  ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. Liang Wenfeng: ์ €ํฌ์˜ ์ฑ„์šฉ ๊ธฐ์ค€์€ ํ•ญ์ƒ ์—ด์ •๊ณผ ํ˜ธ๊ธฐ์‹ฌ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ ํŒ€์› ์ค‘ ์ƒ๋‹น์ˆ˜๊ฐ€ ํŠน์ดํ•œ ๊ฒฝํ—˜์„ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ , ์ด๋Š” ๋งค์šฐ ํฅ๋ฏธ๋กญ์Šต๋‹ˆ๋‹ค. ๊ทธ๋“ค์€ ์ข…์ข… ๋ˆ์„ ๋ฒŒ๊ธฐ ์ „์— ์—ฐ๊ตฌ๋ฅผ ํ•˜๊ณ ์ž ํ•˜๋Š” ์—ด๋ง์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํŠธ๋žœ์Šคํฌ๋จธ๋Š” ๊ตฌ๊ธ€์˜ AI ๋žฉ์—์„œ, ChatGPT๋Š” OpenAI์—์„œ ํƒ„์ƒํ–ˆ์Šต๋‹ˆ๋‹ค. ๋Œ€๊ธฐ์—…์˜ AI ์—ฐ๊ตฌ์†Œ์™€ ์Šคํƒ€ํŠธ์—…์˜ ํ˜์‹ ์˜ ๊ฐ€์น˜๋ฅผ ์–ด๋–ป๊ฒŒ ๋น„๊ตํ•˜์‹œ๋‚˜์š”? Liang Wenfeng: Google์˜ AI Lab, OpenAI, ์‹ฌ์ง€์–ด ์ค‘๊ตญ ๊ธฐ์ˆ  ๊ธฐ์—…์˜ AI ์—ฐ๊ตฌ์†Œ๋Š” ๋ชจ๋‘ ์—„์ฒญ๋‚œ ๊ฐ€์น˜๋ฅผ ์ง€๋‹ˆ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. OpenAI๊ฐ€ ์„ฑ๊ณตํ•  ์ˆ˜ ์žˆ์—ˆ๋˜ ๊ฒƒ์€ ๋ถ€๋ถ„์ ์œผ๋กœ๋Š” ๋ช‡ ๊ฐ€์ง€ ์—ญ์‚ฌ์  ์šฐ์—ฐ์ด ์žˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ํ˜์‹ ์€ ์ฃผ๋กœ ์šด์˜ ๋ฌธ์ œ์ธ๊ฐ€์š”? ์‚ฌ๋ฌด์‹ค์˜ ํšŒ์˜์‹ค ๊ฐ€์šด๋ฐ ์ค„์— ์–‘์ชฝ์— ๋ˆ„๊ตฌ๋‚˜ ์—ด ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ด ์žˆ๋Š” ๊ฒƒ์„ ๋ณด์•˜์Šต๋‹ˆ๋‹ค. ๋™๋ฃŒ๋“ค์€ ์ด ๋””์ž์ธ์ด ์šฐ์—ฐ์˜ ์—ฌ์ง€๋ฅผ ๋‚จ๊ฒจ๋‘”๋‹ค๊ณ  ๋งํ•˜๋”๊ตฐ์š”. ํŠธ๋žœ์Šคํฌ๋จธ์˜ ํƒ„์ƒ์—๋Š” ๋ˆ„๊ตฐ๊ฐ€๊ฐ€ ํ† ๋ก ์„ ์šฐ์—ฐํžˆ ๋“ฃ๊ณ  ์ฐธ์—ฌํ•˜์—ฌ ๊ถ๊ทน์ ์œผ๋กœ ์ผ๋ฐ˜์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ „ํ™˜ํ•˜๋Š” ๊ณผ์ •์ด ํฌํ•จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฆฌ์•™ ์›ฌํŽ‘: ํ˜์‹ ์€ ๋ฏฟ์Œ์—์„œ ์‹œ์ž‘๋œ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์‹ค๋ฆฌ์ฝ˜๋ฐธ๋ฆฌ๊ฐ€ ํ˜์‹ ์ ์ธ ์ด์œ ๋Š” ๋ฌด์—‡์ผ๊นŒ์š”? ๊ณผ๊ฐํ•˜๊ฒŒ ๋„์ „ํ•˜๊ธฐ ๋•Œ๋ฌธ์ด์ฃ . ChatGPT๊ฐ€ ๋‚˜์™”์„ ๋•Œ ์ค‘๊ตญ์˜ ๊ธฐ์ˆ  ์ปค๋ฎค๋‹ˆํ‹ฐ๋Š” ํ”„๋ก ํ‹ฐ์–ด ํ˜์‹ ์— ๋Œ€ํ•œ ์ž์‹ ๊ฐ์ด ๋ถ€์กฑํ–ˆ์Šต๋‹ˆ๋‹ค. ํˆฌ์ž์ž๋ถ€ํ„ฐ ๋Œ€๊ธฐ์—…๊นŒ์ง€ ๋ชจ๋‘ ๊ฒฉ์ฐจ๊ฐ€ ๋„ˆ๋ฌด ํฌ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๊ณ  ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์ง‘์ค‘ํ•˜๊ธฐ๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ํ˜์‹ ์€ ์ž์‹ ๊ฐ์—์„œ ์‹œ์ž‘๋˜๋ฉฐ, ์šฐ๋ฆฌ๋Š” ์ข…์ข… ์ Š์€์ด๋“ค์—๊ฒŒ์„œ ๋” ๋งŽ์ด ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ํŽ€๋“œ๋ ˆ์ด์ง•์ด๋‚˜ ๋Œ€์ค‘๊ณผ์˜ ์†Œํ†ต์„ ํ•˜์ง€ ์•Š์œผ์…”์„œ ์ ๊ทน์ ์œผ๋กœ ํŽ€๋“œ๋ ˆ์ด์ง•์„ ํ•˜๋Š” ํšŒ์‚ฌ๋“ค์— ๋น„ํ•ด ์ธ์ง€๋„๊ฐ€ ๋‚ฎ์€ ๊ฒƒ ๊ฐ™๋„ค์š”. ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ๋”ฅ์‹œํฌ๊ฐ€ LLM ๊ด€๋ จ ์ข…์‚ฌ์ž๋“ค์—๊ฒŒ ์ตœ๊ณ ์˜ ์„ ํƒ์œผ๋กœ ๋‚จ์„ ์ˆ˜ ์žˆ์„๊นŒ์š”? Liang Wenfeng: ๊ฐ€์žฅ ์–ด๋ ค์šด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ตœ๊ณ ์˜ ์ธ์žฌ๋“ค์€ ์„ธ๊ณ„์—์„œ ๊ฐ€์žฅ ์–ด๋ ค์šด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ๊ฐ€์žฅ ํฐ ๋งค๋ ฅ์„ ๋А๋‚๋‹ˆ๋‹ค. ์‚ฌ์‹ค ์ค‘๊ตญ์˜ ์ตœ๊ณ  ์ธ์žฌ๋“ค์€ ์‚ฌํšŒ์ ์œผ๋กœ ํ•˜๋“œ์ฝ”์–ดํ•œ ํ˜์‹ ์ด ๊ฑฐ์˜ ์ด๋ฃจ์–ด์ง€์ง€ ์•Š์•„ ์ธ์ •๋ฐ›์ง€ ๋ชปํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ณผ์†Œํ‰๊ฐ€๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๊ฐ€์žฅ ์–ด๋ ค์šด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋Š” ๋ณธ์งˆ์ ์œผ๋กœ ๊ทธ๋“ค์—๊ฒŒ ๋งค๋ ฅ์ ์ž…๋‹ˆ๋‹ค. ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ์ตœ์ข… ๋ชฉํ‘œ๋Š” ๋ฌด์—‡์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜์‹œ๋‚˜์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ๊ณต๊ธ‰๋ง์˜ ๋ชจ๋“  ๋…ธ๋“œ์—์„œ ๊ด‘๋ฒ”์œ„ํ•œ ์ „๋ฌธํ™”๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๊ณผ ์„œ๋น„์Šค๋ฅผ ์ œ๊ณตํ•˜๋Š” ์ „๋ฌธ ๊ธฐ์—…์ด ๋“ฑ์žฅํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋” ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด ์ด ๋ชจ๋“  ๊ฒƒ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์‚ฌํšŒ์˜ ๋‹ค์–‘ํ•œ ์š”๊ตฌ๋ฅผ ์ถฉ์กฑ์‹œํ‚ฌ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ๋Œ€ํ˜• ๋ชจ๋ธ ์Šคํƒ€ํŠธ์—…๋“ค์€ [๊ธฐ์ˆ ๊ณผ ์ƒ์šฉํ™”]๋ฅผ ๋ชจ๋‘ ์ถ”๊ตฌํ•œ๋‹ค๊ณ  ์ฃผ์žฅํ•˜์ง€๋งŒ, ๊ฒฐ๊ตญ ๊ธฐ์ˆ  ์šฐ์œ„๋ฅผ ์ œํ’ˆ์œผ๋กœ ์ „ํ™˜ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ์˜ ์ฐฝ์„ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ธฐ์ˆ ์ด ์˜๊ตฌ์ ์ธ ๋ฆฌ๋”์‹ญ์„ ๊ฐ€์ ธ๋‹ค์ฃผ์ง€๋Š” ์•Š์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋”ฅ์‹œํฌ์˜ ๋ชจ๋ธ ์—ญ๋Ÿ‰์ด ์•„์ง ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ๊ณผ๊ฐํ•˜๊ฒŒ ๋ชจ๋ธ ์—ฐ๊ตฌ์— ์ง‘์ค‘ํ•˜๋Š” ๊ฑด๊ฐ€์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ์ด๋Ÿฌํ•œ ๋น„์ฆˆ๋‹ˆ์Šค ํŒจํ„ด์€ ๋ชจ๋‘ ์ด์ „ ์„ธ๋Œ€์˜ ์‚ฐ๋ฌผ์ด๋ฉฐ ๋ฏธ๋ž˜์—๋Š” ํ†ตํ•˜์ง€ ์•Š์„ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ธํ„ฐ๋„ท ๋น„์ฆˆ๋‹ˆ์Šค ๋…ผ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฏธ๋ž˜์˜ AI ์ˆ˜์ต ๋ชจ๋ธ์„ ๋…ผ์˜ํ•˜๋Š” ๊ฒƒ์€ ๋งˆ์น˜ ํฌ๋‹ˆ ๋งˆ๊ฐ€ ์‚ฌ์—…์„ ์‹œ์ž‘ํ•  ๋•Œ ์ œ๋„ˆ๋Ÿด ์ผ๋ ‰ํŠธ๋ฆญ๊ณผ ์ฝ”์นด์ฝœ๋ผ์— ๋Œ€ํ•ด ๋…ผ์˜ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋ฌด์˜๋ฏธํ•œ ๋…ผ์˜(ๅˆป่ˆŸๆฑ‚ๅ‰‘)์ž…๋‹ˆ๋‹ค. ๊ณผ๊ฑฐ ํ•˜์ดํ”Œ๋ผ์ด์–ด ํ€€ํŠธ ํŽ€๋“œ๋Š” ๊ธฐ์ˆ ๊ณผ ํ˜์‹ ์— ํƒ„ํƒ„ํ•œ ๊ธฐ๋ฐ˜์„ ๊ฐ€์ง€๊ณ  ์žˆ์—ˆ๊ณ  ์„ฑ์žฅ๋„ ๋น„๊ต์  ์ˆœ์กฐ๋กœ์› ์Šต๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด ๋‚™๊ด€์ ์ธ ์ด์œ ์ธ๊ฐ€์š”?

๊ทธ ์ „์—๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์ค‘๊ตญ ๊ธฐ์—…์ด ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์œ„ํ•ด ํ˜„ ์„ธ๋Œ€์˜ ๋ผ๋งˆ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ง์ ‘ ๋ณต์‚ฌํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ ๊ตฌ์กฐ์—์„œ ์‹œ์ž‘ํ•œ ์ด์œ ๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”? Liang Wenfeng: ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ๋ผ๋ฉด ๋น ๋ฅธ ์ œํ’ˆ ๋ฐฐํฌ๋ฅผ ์œ„ํ•ด ๋ผ๋งˆ ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ํ•ฉ๋ฆฌ์ ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์šฐ๋ฆฌ์˜ ๋ชฉํ‘œ๋Š” AGI์ด๋ฏ€๋กœ ์ œํ•œ๋œ ๋ฆฌ์†Œ์Šค๋กœ ๋” ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ ๊ธฐ๋Šฅ์„ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•ด ์ƒˆ๋กœ์šด ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์—ฐ๊ตฌํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋” ํฐ ๋ชจ๋ธ๋กœ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ๊ธฐ๋ณธ์ ์ธ ์—ฐ๊ตฌ ๋ถ„์•ผ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ชจ๋ธ ๊ตฌ์กฐ ์™ธ์—๋„ ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ๊ณผ ๋ชจ๋ธ์„ ๋ณด๋‹ค ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๋“ฑ ๋‹ค๋ฅธ ์˜์—ญ์—์„œ๋„ ๊ด‘๋ฒ”์œ„ํ•œ ์—ฐ๊ตฌ๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์œผ๋ฉฐ, ์ด๋Š” ๋ชจ๋‘ ์ด๋ฒˆ์— ์ถœ์‹œํ•œ ๋ชจ๋ธ์— ๋ฐ˜์˜๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ•™์Šต ํšจ์œจ์„ฑ๊ณผ ์ถ”๋ก  ๋น„์šฉ ์ธก๋ฉด์—์„œ ๋ผ๋งˆ์˜ ๊ตฌ์กฐ๋Š” ํ•™์Šต ํšจ์œจ์„ฑ๊ณผ ์ถ”๋ก  ๋น„์šฉ์— ์žˆ์–ด ๊ตญ์ œ์ ์ธ ํ”„๋ก ํ‹ฐ์–ด ์ˆ˜์ค€๊ณผ 2์„ธ๋Œ€ ๊ฒฉ์ฐจ๊ฐ€ ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„ธ๋Œ€ ์ฐจ์ด๋Š” ์ฃผ๋กœ ์–ด๋””์—์„œ ๋ฐœ์ƒํ•˜๋‚˜์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ์šฐ์„  ํ›ˆ๋ จ ํšจ์œจ์„ฑ์˜ ๊ฒฉ์ฐจ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ตญ์ œ ์ตœ๊ณ  ์ˆ˜์ค€๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ์ค‘๊ตญ์˜ ์ตœ๊ณ  ์—ญ๋Ÿ‰์€ ๋ชจ๋ธ ๊ตฌ์กฐ์™€ ํ›ˆ๋ จ ์—ญํ•™์—์„œ ๋‘ ๋ฐฐ์˜ ๊ฒฉ์ฐจ๊ฐ€ ์žˆ์„ ๊ฒƒ์œผ๋กœ ์ถ”์ •๋˜๋Š”๋ฐ, ์ด๋Š” ๋™์ผํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด ๋‘ ๋ฐฐ์˜ ์ปดํ“จํŒ… ํŒŒ์›Œ๋ฅผ ์†Œ๋น„ํ•ด์•ผ ํ•œ๋‹ค๋Š” ์˜๋ฏธ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ฐ์ดํ„ฐ ํšจ์œจ์„ฑ์—์„œ๋„ 2๋ฐฐ์˜ ๊ฒฉ์ฐจ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๋™์ผํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด ๋‘ ๋ฐฐ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ์ปดํ“จํŒ… ํŒŒ์›Œ๋ฅผ ์†Œ๋น„ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ชจ๋‘ ํ•ฉ์น˜๋ฉด ์ปดํ“จํŒ… ์„ฑ๋Šฅ์ด 4๋ฐฐ ๋” ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ํ•˜๊ณ ์ž ํ•˜๋Š” ๊ฒƒ์€ ์ด๋Ÿฌํ•œ ๊ฒฉ์ฐจ๋ฅผ ๊ณ„์† ์ขํžˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์ค‘๊ตญ ๊ธฐ์—…๋“ค์€ ๋ชจ๋ธ๊ณผ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋ชจ๋‘ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฅ์‹œํฌ๋Š” ์™œ ์—ฐ๊ตฌ์™€ ํƒ์ƒ‰์—๋งŒ ์ง‘์ค‘ํ•˜๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ๋‚˜์š”? Liang Wenfeng: ์ง€๊ธˆ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ๊ธ€๋กœ๋ฒŒ ํ˜์‹ ์˜ ๋ฌผ๊ฒฐ์— ๋™์ฐธํ•˜๋Š” ๊ฒƒ์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ˆ˜๋…„ ๋™์•ˆ ์ค‘๊ตญ ๊ธฐ์—…๋“ค์€ ๋‹ค๋ฅธ ๊ธฐ์—…๋“ค์ด ๊ธฐ์ˆ  ํ˜์‹ ์„ ํ•˜๋Š” ๋ฐ ์ต์ˆ™ํ•ด์กŒ๊ณ , ์šฐ๋ฆฌ๋Š” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ˆ˜์ตํ™”์— ์ง‘์ค‘ํ–ˆ์ง€๋งŒ ์ด๋Š” ํ”ผํ•  ์ˆ˜ ์—†๋Š” ํ๋ฆ„์ž…๋‹ˆ๋‹ค. ์ด ๋ฌผ๊ฒฐ ์†์—์„œ ์šฐ๋ฆฌ์˜ ์ถœ๋ฐœ์ ์€ ๋‹จ๊ธฐ๊ฐ„์— ์ˆ˜์ต์„ ์ฐฝ์ถœํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๊ธฐ์ˆ ์  ํ•œ๊ณ„์— ๋„๋‹ฌํ•˜๊ณ  ์ „์ฒด ์ƒํƒœ๊ณ„์˜ ๋ฐœ์ „์„ ์ฃผ๋„ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ธํ„ฐ๋„ท๊ณผ ๋ชจ๋ฐ”์ผ ์ธํ„ฐ๋„ท ์‹œ๋Œ€๋ฅผ ๊ฑฐ์น˜๋ฉด์„œ ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ๋žŒ๋“ค์€ ๋ฏธ๊ตญ์ด ๊ธฐ์ˆ  ํ˜์‹ ์— ๋›ฐ์–ด๋‚˜๊ณ  ์ค‘๊ตญ์€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ œ์ž‘์— ๋›ฐ์–ด๋‚˜๋‹ค๋Š” ๋ฏฟ์Œ์„ ๊ฐ–๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฆฌ์•™ ์›ฌํŽ‘: ์šฐ๋ฆฌ๋Š” ๊ฒฝ์ œ๊ฐ€ ๋ฐœ์ „ํ•จ์— ๋”ฐ๋ผ ์ค‘๊ตญ์ด ๋ฌด์ž„์Šน์ฐจํ•˜๋Š” ๋Œ€์‹  ์ ์ฐจ ๊ธฐ์—ฌํ•˜๋Š” ๊ตญ๊ฐ€๊ฐ€ ๋˜์–ด์•ผ ํ•œ๋‹ค๊ณ  ๋ฏฟ์Šต๋‹ˆ๋‹ค. ์ง€๋‚œ 30๋…„ ์ด์ƒ์˜ IT ๋ฌผ๊ฒฐ ์†์—์„œ ์šฐ๋ฆฌ๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ ์ง„์ •ํ•œ ๊ธฐ์ˆ  ํ˜์‹ ์— ์ฐธ์—ฌํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋ฌด์–ด์˜ ๋ฒ•์น™์ด ํ•˜๋Š˜์—์„œ ๋–จ์–ด์ง€๊ณ  ๋” ๋‚˜์€ ํ•˜๋“œ์›จ์–ด์™€ ์†Œํ”„ํŠธ์›จ์–ด๊ฐ€ ๋“ฑ์žฅํ•  ๋•Œ๊นŒ์ง€ 18๊ฐœ์›” ๋™์•ˆ ์ง‘์— ๋ˆ„์›Œ ๊ธฐ๋‹ค๋ฆฌ๋Š” ๋ฐ ์ต์ˆ™ํ•ด์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ์Šค์ผ€์ผ๋ง ๋ฒ•์น™์ด ๊ทธ๋Ÿฐ ์‹์œผ๋กœ ์ทจ๊ธ‰๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‚ฌ์‹ค ์ด๊ฒƒ์€ ์„œ๊ตฌ ์ฃผ๋„์˜ ์—ฌ๋Ÿฌ ์„ธ๋Œ€์— ๊ฑธ์นœ ๊ธฐ์ˆ  ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ๋Š์ž„์—†๋Š” ๋…ธ๋ ฅ์„ ํ†ตํ•ด ๋งŒ๋“ค์–ด์ง„ ๋ฒ•์น™์ž…๋‹ˆ๋‹ค. ๋‹จ์ง€ ์šฐ๋ฆฌ๊ฐ€ ์ด ๊ณผ์ •์— ์ฐธ์—ฌํ•˜์ง€ ์•Š์•˜๋‹ค๋Š” ์ด์œ ๋กœ ๊ทธ ์กด์žฌ๋ฅผ ๋ฌด์‹œํ•ด ์™”์„ ๋ฟ์ž…๋‹ˆ๋‹ค. DeepSeek V2๊ฐ€ ์‹ค๋ฆฌ์ฝ˜ ๋ฐธ๋ฆฌ์˜ ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์„ ๋†€๋ผ๊ฒŒ ํ•œ ์ด์œ ๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”? Liang Wenfeng: ๋ฏธ๊ตญ์—์„œ ๋งค์ผ ์ผ์–ด๋‚˜๋Š” ์ˆ˜๋งŽ์€ ํ˜์‹  ์ค‘์—์„œ ์ด๊ฒƒ์€ ๋งค์šฐ ํ‰๋ฒ”ํ•œ ์ผ์ž…๋‹ˆ๋‹ค. ์ค‘๊ตญ ๊ธฐ์—…์ด ํ˜์‹ ์— ๊ธฐ์—ฌํ•˜๋Š” ๊ธฐ์—…์œผ๋กœ ์ฐธ์—ฌํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ๋†€๋ž๋˜ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ๋Œ€๋ถ€๋ถ„์˜ ์ค‘๊ตญ ๊ธฐ์—…์€ ํ˜์‹ ์ด ์•„๋‹Œ ์ถ”์ข…์— ์ต์ˆ™ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ค‘๊ตญ ์ƒํ™ฉ์—์„œ ํ˜์‹ ์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์€ ๋งค์šฐ ์‚ฌ์น˜์Šค๋Ÿฌ์šด ๊ฒฐ์ •์ž…๋‹ˆ๋‹ค. ๋Œ€ํ˜• ๋ชจ๋ธ์€ ๋ง‰๋Œ€ํ•œ ํˆฌ์ž๊ฐ€ ํ•„์š”ํ•œ ๊ฒŒ์ž„์ด๋ฉฐ, ๋ชจ๋“  ๊ธฐ์—…์ด ์ƒ์šฉํ™”๋ฅผ ๋จผ์ € ์ƒ๊ฐํ•˜์ง€ ์•Š๊ณ  ์—ฐ๊ตฌ์™€ ํ˜์‹ ์—๋งŒ ์ง‘์ค‘ํ•  ์ˆ˜ ์žˆ๋Š” ์ž๋ณธ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ๋ฆฌ์•™ ์›ฌํŽ‘: ํ˜์‹  ๋น„์šฉ์ด ๊ฒฐ์ฝ” ๋‚ฎ์ง€ ์•Š์œผ๋ฉฐ, ๋ฌด๋ถ„๋ณ„ํ•œ ์ฐจ์ž…์— ๋Œ€ํ•œ ๊ณผ๊ฑฐ์˜ ๊ฒฝํ–ฅ๋„ ์ค‘๊ตญ์˜ ์ด์ „ ์ƒํ™ฉ๊ณผ ๊ด€๋ จ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ง€๊ธˆ์€ ์ค‘๊ตญ์˜ ๊ฒฝ์ œ ๊ทœ๋ชจ๋‚˜ ๋ฐ”์ดํŠธ๋Œ„์Šค, ํ…์„ผํŠธ์™€ ๊ฐ™์€ ๊ฑฐ๋Œ€ ๊ธฐ์—…์˜ ์ด์ต ๋“ฑ ๊ธ€๋กœ๋ฒŒ ๊ธฐ์ค€์œผ๋กœ ๋ณผ ๋•Œ ์–ด๋А ๊ฒƒ ํ•˜๋‚˜ ๋‚ฎ์€ ๊ฒƒ์ด ์—†์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์—๊ฒŒ ํ˜์‹ ์—์„œ ๋ถ€์กฑํ•œ ๊ฒƒ์€ ์ž๋ณธ์ด ์•„๋‹ˆ๋ผ ํšจ๊ณผ์ ์ธ ํ˜์‹ ์„ ์œ„ํ•ด ๊ณ ๋ฐ€๋„ ์ธ์žฌ๋ฅผ ์กฐ์งํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์ž์‹ ๊ฐ๊ณผ ์ง€์‹์ด ๋ถ€์กฑํ•˜๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฑฐ๋Œ€ ๊ธฐ์ˆ  ๋Œ€๊ธฐ์—…์„ ํฌํ•จํ•œ ์ค‘๊ตญ ๊ธฐ์—…๋“ค์ด ๋น ๋ฅธ ์ƒ์šฉํ™”๋ฅผ ์ตœ์šฐ์„  ์ˆœ์œ„๋กœ ์‚ผ๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ์ง€๋‚œ 30๋…„ ๋™์•ˆ ์šฐ๋ฆฌ๋Š” ํ˜์‹ ์„ ์†Œํ™€ํžˆ ํ•œ ์ฑ„ ์ˆ˜์ต ์ฐฝ์ถœ๋งŒ์„ ๊ฐ•์กฐํ•ด ์™”์Šต๋‹ˆ๋‹ค. ํ˜์‹ ์€ ์ „์ ์œผ๋กœ ๋น„์ฆˆ๋‹ˆ์Šค ์ค‘์‹ฌ์ด ์•„๋‹ˆ๋ผ ํ˜ธ๊ธฐ์‹ฌ๊ณผ ์ฐฝ์กฐ์— ๋Œ€ํ•œ ์—ด๋ง๋„ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์˜ค๋ž˜๋œ ์Šต๊ด€์˜ ์ œ์•ฝ์„ ๋ฐ›์•˜์„ ๋ฟ์ธ๋ฐ, ์ด๋Š” ํŠน์ • ๊ฒฝ์ œ ๊ตญ๋ฉด๊ณผ ๊ด€๋ จ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ท€์‚ฌ๋Š” ๊ถ๊ทน์ ์œผ๋กœ ๊ณต์ต ์—ฐ๊ตฌ ๊ธฐ๊ด€์ด ์•„๋‹ˆ๋ผ ๋น„์ฆˆ๋‹ˆ์Šค ์กฐ์ง์ธ๋ฐ, ํ˜์‹ ์„ ์„ ํƒํ•˜๊ณ  ๊ทธ ํ˜์‹ ์„ ์˜คํ”ˆ์†Œ์Šคํ™”ํ•  ๋•Œ ํ•ด์ž๋ฅผ ์–ด๋””์— ๊ตฌ์ถ•ํ• ๊นŒ์š”? 5์›”์— ๊ณต๊ฐœํ•œ MLA ์•„ํ‚คํ…์ฒ˜๋Š” ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์ด ๋น ๋ฅด๊ฒŒ ๋ชจ๋ฐฉํ•˜์ง€ ์•Š์„๊นŒ์š”? Liang Wenfeng: ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ  ์•ž์—์„œ ํด๋กœ์ฆˆ๋“œ ์†Œ์Šค๋กœ ๋งŒ๋“  ํ•ด์ž๋Š” ์ผ์‹œ์ ์ž…๋‹ˆ๋‹ค. OpenAI์˜ ํด๋กœ์ฆˆ๋“œ ์†Œ์Šค ์ ‘๊ทผ ๋ฐฉ์‹๋„ ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์ด ๋”ฐ๋ผ์žก๋Š” ๊ฒƒ์„ ๋ง‰์„ ์ˆ˜๋Š” ์—†์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ์šฐ๋ฆฌ๋Š” ํŒ€์›๋“ค์ด ์ด ๊ณผ์ •์„ ํ†ตํ•ด ์„ฑ์žฅํ•˜๊ณ  ๋…ธํ•˜์šฐ๋ฅผ ์ถ•์ ํ•˜๋ฉฐ ํ˜์‹ ํ•  ์ˆ˜ ์žˆ๋Š” ์กฐ์ง๊ณผ ๋ฌธํ™”๋ฅผ ํ˜•์„ฑํ•˜๋Š” ๋ฐ ๊ฐ€์น˜๋ฅผ ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด ์šฐ๋ฆฌ์˜ ํ•ด์ž์ž…๋‹ˆ๋‹ค. ์˜คํ”ˆ ์†Œ์Šค, ๋…ผ๋ฌธ ๋ฐœํ‘œ๋Š” ์‚ฌ์‹ค ๋น„์šฉ์ด ๋“ค์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ธฐ์ˆ  ์ธ์žฌ์˜ ๊ฒฝ์šฐ ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์ด ์ž์‹ ์˜ ํ˜์‹ ์„ ๋”ฐ๋ฅด๊ฒŒ ๋˜๋ฉด ํฐ ์„ฑ์ทจ๊ฐ์„ ๋А๋‚„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์‹ค ์˜คํ”ˆ์†Œ์Šค๋Š” ์ƒ์—…์ ์ด๋ผ๊ธฐ๋ณด๋‹ค๋Š” ๋ฌธํ™”์  ํ–‰๋™์— ๊ฐ€๊น๊ธฐ ๋•Œ๋ฌธ์— ์˜คํ”ˆ์†Œ์Šค์— ๊ธฐ์—ฌํ•˜๋ฉด ์กด๊ฒฝ๋ฐ›์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ธฐ์—…์ด ์˜คํ”ˆ์†Œ์Šค์— ์ฐธ์—ฌํ•˜๋Š” ๋ฐ์—๋Š” ๋ฌธํ™”์  ๋งค๋ ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ ์ˆœ์ˆ˜ํ•œ ๊ธฐ์ˆ  ๋ฆฌ๋”์‹ญ์ด ์ ˆ๋Œ€์ ์ธ ์šฐ์œ„๋ฅผ ์ ํ•˜๋Š” ๊ฒฝ์šฐ๋Š” ๋“œ๋ญ…๋‹ˆ๋‹ค. ์–ด๋–ค ๋” ํฐ ๊ฒƒ์— ๋ฒ ํŒ…ํ•˜๊ณ  ๊ณ„์‹ ๊ฐ€์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ์šฐ๋ฆฌ๊ฐ€ ๋ณด๋Š” ๊ฒƒ์€ ์ค‘๊ตญ AI๊ฐ€ ์˜์›ํžˆ ๋”ฐ๋ผ์žก์„ ์ˆ˜ ์—†๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ํ”ํžˆ ์ค‘๊ตญ AI์™€ ๋ฏธ๊ตญ ์‚ฌ์ด์— 1~2๋…„์˜ ๊ฒฉ์ฐจ๊ฐ€ ์žˆ๋‹ค๊ณ  ๋งํ•˜์ง€๋งŒ, ์‹ค์ œ ๊ฒฉ์ฐจ๋Š” ๋…์ฐฝ์„ฑ๊ณผ ๋ชจ๋ฐฉ์„ฑ์˜ ์ฐจ์ด์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด ๋ณ€ํ•˜์ง€ ์•Š๋Š”๋‹ค๋ฉด ์ค‘๊ตญ์€ ํ•ญ์ƒ ์ถ”์ข…์ž์— ๋ถˆ๊ณผํ•  ๊ฒƒ์ด๋ฏ€๋กœ ์•ฝ๊ฐ„์˜ ํƒํ—˜์€ ํ”ผํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์—”๋น„๋””์•„์˜ ๋ฆฌ๋”์‹ญ์€ ํ•œ ํšŒ์‚ฌ์˜ ๋…ธ๋ ฅ๋งŒ์ด ์•„๋‹ˆ๋ผ ์„œ๊ตฌ ๊ธฐ์ˆ  ์ปค๋ฎค๋‹ˆํ‹ฐ์™€ ์—…๊ณ„ ์ „์ฒด๊ฐ€ ํ•จ๊ป˜ ๋…ธ๋ ฅํ•œ ๊ฒฐ๊ณผ์ž…๋‹ˆ๋‹ค. ๊ทธ๋“ค์€ ์ฐจ์„ธ๋Œ€ ๊ธฐ์ˆ  ํŠธ๋ Œ๋“œ๋ฅผ ํŒŒ์•…ํ•˜๊ณ  ๋กœ๋“œ๋งต์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ค‘๊ตญ์˜ AI ๊ฐœ๋ฐœ์—๋Š” ์ด๋Ÿฌํ•œ ์ƒํƒœ๊ณ„๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋งŽ์€ ๊ตญ๋‚ด ์นฉ ๊ฐœ๋ฐœ ์—…์ฒด๋Š” ๊ธฐ์ˆ  ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ๋ถ€์กฑํ•˜๊ณ  ๊ฐ„์ ‘์ ์ธ ์ •๋ณด๋งŒ ๊ฐ€์ง€๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ค‘๊ตญ์€ ํ•„์—ฐ์ ์œผ๋กœ ๊ธฐ์ˆ  ์ตœ์ „์„ ์— ์„œ ์žˆ๋Š” ์‚ฌ๋žŒ๋“ค์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ž๊ธˆ ์กฐ๋‹ฌ ๊ณ„ํš์ด ์žˆ๋‚˜์š”? ํ•˜์ดํ”Œ๋ผ์ด์–ด๊ฐ€ IPO๋ฅผ ์œ„ํ•ด ๋”ฅ์‹œํฌ๋ฅผ ๋ถ„์‚ฌํ•  ๊ณ„ํš์ด๋ผ๋Š” ์–ธ๋ก  ๋ณด๋„๋ฅผ ๋ณธ ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค๋ฆฌ์ฝ˜๋ฐธ๋ฆฌ์˜ AI ์Šคํƒ€ํŠธ์—…์€ ๊ฒฐ๊ตญ ๋Œ€๊ธฐ์—…์— ์ข…์†๋  ์ˆ˜๋ฐ–์— ์—†์ž–์•„์š”. ๋ฆฌ์•™ ์›ฌํŽ‘: ๋‹จ๊ธฐ์ ์œผ๋กœ๋Š” ์ž๊ธˆ ์กฐ๋‹ฌ ๊ณ„ํš์ด ์—†์Šต๋‹ˆ๋‹ค. ์ €ํฌ์—๊ฒŒ๋Š” ๋ˆ์ด ๋ฌธ์ œ๊ฐ€ ์•„๋‹ˆ๋ผ ๊ณ ๊ธ‰ ์นฉ์˜ ์ถœํ•˜ ๊ธˆ์ง€๊ฐ€ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ํŒŒ๋„: ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด AGI ๊ฐœ๋ฐœ๊ณผ ์–‘์  ๊ธˆ์œต์€ ์™„์ „ํžˆ ๋‹ค๋ฅธ ๋…ธ๋ ฅ์ด๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์–‘์  ๊ธˆ์œต์€ ์กฐ์šฉํžˆ ์ถ”๊ตฌํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, AGI๋Š” ํˆฌ์ž๋ฅผ ํ™•๋Œ€ํ•˜๊ธฐ ์œ„ํ•ด ์ œํœด๋ฅผ ๋งบ๋Š” ๋“ฑ ๋ˆˆ์— ๋„๊ณ  ๋Œ€๋‹ดํ•œ ์ ‘๊ทผ์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Liang Wenfeng: ๋” ๋งŽ์€ ํˆฌ์ž๊ฐ€ ๋” ๋งŽ์€ ํ˜์‹ ์„ ๊ฐ€์ ธ์˜ค๋Š” ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ๊ทธ๋ ‡์ง€ ์•Š์•˜๋‹ค๋ฉด ๋Œ€๊ธฐ์—…์ด ์ด๋ฏธ ๋ชจ๋“  ํ˜์‹ ์„ ๋…์ ํ–ˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์šด์˜ ์ „๋ฌธ์„ฑ์ด ๋ถ€์กฑํ•ด์„œ ์ง€๊ธˆ์€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์ง‘์ค‘ํ•˜์ง€ ์•Š๋Š” ๊ฑด ์•„๋‹Œ๊ฐ€์š”? ๋ฆฌ์•™ ์›ฌํŽ‘: ํ˜„์žฌ ๋‹จ๊ณ„๋Š” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ด ์•„๋‹Œ ๊ธฐ์ˆ  ํ˜์‹ ์ด ํญ๋ฐœ์ ์œผ๋กœ ์„ฑ์žฅํ•˜๋Š” ์‹œ๊ธฐ๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์žฅ๊ธฐ์ ์œผ๋กœ๋Š” ์—…๊ณ„์—์„œ ์ €ํฌ์˜ ๊ธฐ์ˆ ๊ณผ ๊ฒฐ๊ณผ๋ฌผ์„ ์ง์ ‘ ํ™œ์šฉํ•˜๋Š” ์ƒํƒœ๊ณ„๋ฅผ ๋งŒ๋“ค๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๊ธฐ๋ณธ ๋ชจ๋ธ๊ณผ ์ฒจ๋‹จ ํ˜์‹ ์— ์ง‘์ค‘ํ•˜๊ณ , ๋‹ค๋ฅธ ๊ธฐ์—…๋“ค์€ ๋”ฅ์‹œํฌ์˜ ๊ธฐ๋ฐ˜์„ ๋ฐ”ํƒ•์œผ๋กœ B2B ๋ฐ B2C ๋น„์ฆˆ๋‹ˆ์Šค๋ฅผ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์™„์ „ํ•œ ์‚ฐ์—… ๊ฐ€์น˜ ์‚ฌ์Šฌ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด ์šฐ๋ฆฌ๊ฐ€ ์ง์ ‘ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ฐœ๋ฐœํ•  ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ํ•„์š”ํ•˜๋‹ค๋ฉด ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ฐœ๋ฐœํ•  ์ˆ˜๋„ ์žˆ์ง€๋งŒ, ์—ฐ๊ตฌ์™€ ๊ธฐ์ˆ  ํ˜์‹ ์ด ํ•ญ์ƒ ์šฐ๋ฆฌ์˜ ์ตœ์šฐ์„  ์ˆœ์œ„๊ฐ€ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ณ ๊ฐ์ด API๋ฅผ ์„ ํƒํ•  ๋•Œ ๋Œ€๊ธฐ์—…์˜ ์ œํ’ˆ ๋Œ€์‹  ๋”ฅ์‹œํฌ๋ฅผ ์„ ํƒํ•ด์•ผ ํ•˜๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”? Liang Wenfeng: ๋ฏธ๋ž˜์˜ ์„ธ๊ณ„๋Š” ์ „๋ฌธํ™”๋œ ๋ถ„์—…์˜ ์„ธ๊ณ„๊ฐ€ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์ธ ๋Œ€ํ˜• ๋ชจ๋ธ์€ ์ง€์†์ ์ธ ํ˜์‹ ์ด ํ•„์š”ํ•˜๋ฉฐ, ๋Œ€๊ธฐ์—…์€ ์—ญ๋Ÿ‰์— ํ•œ๊ณ„๊ฐ€ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ฐ˜๋“œ์‹œ ์ตœ์„ ์ด ์•„๋‹ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

(์–ธ์ œ๋‚˜ ๊ทธ๋ ‡๋“ฏ) ํŒฉํŠธ๋ฅผ ์ž˜ ๋‹ค๋ค„๋†“์€ ๋ฒค ํ†ฐ์Šจ์˜ ๊ธ€. ๋” ๋งŽ์€ ์ž๋ฃŒ๋ฅผ ์ ‘ํ•œ ํ˜„์žฌ, ๋‚˜๋Š” ์—ฌ์ „ํžˆ ๋™์ผํ•œ ๋ทฐ๋ฅผ ์œ ์ง€ํ•œ๋‹ค. ํ•˜๋‚˜๋งŒ ๋ง๋ถ™์ด๋ฉด, OpenAI์˜ ์ง„์งœ ๊ฐ•๋ ฅํ•จ์€ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์„ ๋„˜์–ด์„œ ๋Œ€๊ทœ๋ชจ๋กœ ์ปดํ“จํ„ฐ๋ฅผ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ ๊ทธ ์ž์ฒด์— ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค. https://stratechery.com/2025/deepseek-faq/ https://blog.naver.com/mynameisdj/223740494847 (ํ•œ๊ธ€ ๋ฒˆ์—ญ)

์—”๋น„๋””์•„๊ฐ€ ์—ฌ์ „ํžˆ ์œ ๋ฆฌํ•œ ์„ธ ๊ฐ€์ง€ ์š”์†Œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, ๋”ฅ์‹œํฌ์˜ ์ ‘๊ทผ ๋ฐฉ์‹์ด H100 ๋˜๋Š” ๊ณง ์ถœ์‹œ๋  GB100์— ์ ์šฉ๋  ๊ฒฝ์šฐ ์–ผ๋งˆ๋‚˜ ์„ฑ๋Šฅ์ด ์ข‹์„๊นŒ์š”? ์ปดํ“จํŒ…์„ ๋” ํšจ์œจ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ฐพ์•˜๋‹ค๊ณ  ํ•ด์„œ ๋” ๋งŽ์€ ์ปดํ“จํŒ…์ด ์œ ์šฉํ•˜์ง€ ์•Š๋‹ค๋Š” ์˜๋ฏธ๋Š” ์•„๋‹™๋‹ˆ๋‹ค. ๋‘˜์งธ, ์ถ”๋ก  ๋น„์šฉ์ด ๋‚ฎ์•„์ง€๋ฉด ์žฅ๊ธฐ์ ์œผ๋กœ๋Š” ์‚ฌ์šฉ๋Ÿ‰์ด ๋Š˜์–ด๋‚  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฌํ‹ฐ์•„ ๋‚˜๋ธ๋ผ Microsoft CEO๋Š” ๋Šฆ์€ ๋ฐค ํŠธ์œ„ํ„ฐ์—์„œ ์‹œ์žฅ์„ ๊ฒจ๋ƒฅํ•œ ๋“ฏํ•œ ํŠธ์œ—์„ ํ†ตํ•ด ์ •ํ™•ํžˆ ์ด๋ ‡๊ฒŒ ๋งํ–ˆ์Šต๋‹ˆ๋‹ค: ์…‹์งธ, R1 ๋ฐ o1๊ณผ ๊ฐ™์€ ์ถ”๋ก  ๋ชจ๋ธ์€ ๋” ๋งŽ์€ ์ปดํ“จํŒ…์„ ์‚ฌ์šฉํ•จ์œผ๋กœ์จ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ์ด๋Œ์–ด๋ƒ…๋‹ˆ๋‹ค. AI์˜ ์„ฑ๋Šฅ๊ณผ ๊ธฐ๋Šฅ์ด ํ–ฅ์ƒ๋ ์ˆ˜๋ก ๋” ๋งŽ์€ ์ปดํ“จํŒ…์— ์˜์กดํ•˜๊ฒŒ ๋˜๋Š” ๋งŒํผ, ์—”๋น„๋””์•„๋Š” ์ด๋“์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค! ํ•˜์ง€๋งŒ ๋ชจ๋“  ๊ฒƒ์ด ์žฅ๋ฐ‹๋น›์ธ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ์ตœ์†Œํ•œ ๋”ฅ์‹œํฌ์˜ ํšจ์œจ์„ฑ๊ณผ ๊ด‘๋ฒ”์œ„ํ•œ ๊ฐ€์šฉ์„ฑ์€ ์ ์–ด๋„ ๋‹จ๊ธฐ์ ์œผ๋กœ๋Š” ๊ฐ€์žฅ ๋‚™๊ด€์ ์ธ ์—”๋น„๋””์•„์˜ ์„ฑ์žฅ ์Šคํ† ๋ฆฌ์— ์ƒ๋‹นํ•œ ์˜๊ตฌ์‹ฌ์„ ๋ถˆ๋Ÿฌ์ผ์œผํ‚ต๋‹ˆ๋‹ค. ๋ชจ๋ธ ๋ฐ ์ธํ”„๋ผ ์ตœ์ ํ™”๋ฅผ ํ†ตํ•ด ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์ด๋“์€ ํŠนํžˆ ์ถ”๋ก ์— ๋Œ€ํ•œ ๋Œ€์•ˆ์ ์ธ ์ ‘๊ทผ ๋ฐฉ์‹์„ ํƒ์ƒ‰ํ•จ์œผ๋กœ์จ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์ƒ๋‹นํ•œ ์ด๋“์ด ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, AMD์˜ ์—ด๋“ฑํ•œ ์นฉ ๊ฐ„ ํ†ต์‹  ๊ธฐ๋Šฅ์„ ์™„์ „ํžˆ ํšŒํ”ผํ•˜์—ฌ ๋…๋ฆฝํ˜• AMD GPU์—์„œ ์ถ”๋ก ์„ ์‹คํ–‰ํ•˜๋Š” ๊ฒƒ์ด ํ›จ์”ฌ ๋” ๊ทธ๋Ÿด๋“ฏํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ถ”๋ก  ๋ชจ๋ธ์€ ๋˜ํ•œ ์ถ”๋ก  ์ „์šฉ ์นฉ์— ๋Œ€ํ•œ ๋ณด์ƒ์„ ๋Š˜๋ ค์ฃผ๋Š”๋ฐ, ์ด๋Š” Nvidia์˜ GPU๋ณด๋‹ค ํ›จ์”ฌ ๋” ์ „๋ฌธํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ œ ๋ฏธ๊ตญ์€ ์„ ํƒ์„ ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋งค์šฐ ๋…ผ๋ฆฌ์ ์ธ ์ด์œ ๋กœ ์นฉ ๊ธˆ์ง€ ์กฐ์น˜๋ฅผ ๋Œ€ํญ ํ™•๋Œ€ํ•˜๊ณ  EU์˜ ๊ธฐ์ˆ  ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋ฐ˜์˜ํ•˜๋Š” ์นฉ ๋ฐ ๋ฐ˜๋„์ฒด ์žฅ๋น„์— ๋Œ€ํ•œ ํ—ˆ๊ฐ€ ๊ธฐ๋ฐ˜ ๊ทœ์ œ ์ฒด์ œ๋ฅผ ๋ถ€๊ณผํ•˜๋Š” ๋“ฑ ๋ฐฉ์–ด ์กฐ์น˜๋ฅผ ๋‘ ๋ฐฐ๋กœ ๊ฐ•ํ™”ํ•  ์ˆ˜๋„ ์žˆ๊ณ , ์•„๋‹ˆ๋ฉด ์šฐ๋ฆฌ์—๊ฒŒ ์ง„์ •ํ•œ ๊ฒฝ์Ÿ์ด ์žˆ์Œ์„ ๊นจ๋‹ซ๊ณ  ์‹ค์ œ๋กœ ๊ฒฝ์Ÿํ•  ์ˆ˜ ์žˆ๋Š” ๊ถŒํ•œ์„ ์Šค์Šค๋กœ ๋ถ€์—ฌํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

๋Ÿ‰์›ํŽ‘์€ ์–ธ๋ก ๊ณผ์˜ ์ธํ„ฐ๋ทฐ์—์„œ "์ค‘๊ตญ๋„ ํ•ญ์ƒ ๋ฌด์ž„์Šน์ฐจ์ž๊ฐ€ ๋˜๊ธฐ๋ณด๋‹ค๋Š” ์ ์ฐจ ๊ธฐ์—ฌ์ž๊ฐ€ ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค."๋ผ๊ณ  ๋งํ–ˆ์Šต๋‹ˆ๋‹ค. "์šฐ๋ฆฌ๋Š” ๋ฌด์–ด์˜ ๋ฒ•์น™์ด ํ•˜๋Š˜์—์„œ ๋–จ์–ด์ง€๋Š” ๊ฒƒ์— ์ต์ˆ™ํ•˜๋ฉฐ, 18๊ฐœ์›” ํ›„์—๋Š” ๋” ๋‚˜์€ ํ•˜๋“œ์›จ์–ด์™€ ์†Œํ”„ํŠธ์›จ์–ด๊ฐ€ ๋‚˜์˜ฌ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์Šค์ผ€์ผ๋ง ๋ฒ•์น™๋„ ์ด๋Ÿฐ ์‹์œผ๋กœ ์ทจ๊ธ‰๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‚ฌ์‹ค ์ด๊ฒƒ์€ ์„œ๊ตฌ ์ฃผ๋„์˜ ๊ธฐ์ˆ  ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ์—ฌ๋Ÿฌ ์„ธ๋Œ€์— ๊ฑธ์ณ ์ง€์น  ์ค„ ๋ชจ๋ฅด๊ณ  ๋งŒ๋“ค์–ด๋‚ธ ๊ฒฐ๊ณผ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์ด ๊ณผ์ •์— ์ฐธ์—ฌํ•˜์ง€ ์•Š์•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ ์กด์žฌ๋ฅผ ๋ฌด์‹œํ•œ ๊ฒƒ๋ฟ์ž…๋‹ˆ๋‹ค. ๋งŽ์€ ๊ตญ๋‚ด ์นฉ์€ ์ง€์› ๊ธฐ์ˆ  ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ๋ถ€์กฑํ•˜๊ณ  ๊ฐ„์ ‘ ์ •๋ณด ๋งŒ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฐœ๋ฐœํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์ค‘๊ตญ์€ ๋ฐ˜๋“œ์‹œ ๊ธฐ์ˆ ์˜ ์ตœ์ „์„ ์— ์„œ์•ผ ํ•ฉ๋‹ˆ๋‹ค." ์ฃผ์š” ์ธ๋ ฅ์˜ ๋ฐฐ๊ฒฝ ๋Œ€๋‹ค์ˆ˜๊ฐ€ โ€œ์ฒญ๋ฒ ์ด(ๆธ…ๅŒ— ์ฆ‰ ์ฒญํ™”๋Œ€ยท๋ฒ ์ด์ง•๋Œ€)โ€ ๋“ฑ ์ค‘๊ตญ ๋ช…๋ฌธ๋Œ€ ์ถœ์‹ ์—, ํ•™๋ถ€ ์กธ์—… ์งํ›„๋‚˜ ๋ฐ•์‚ฌ ๊ณผ์ • ์—ฐ๊ตฌ ์ค‘์— ํ•ฉ๋ฅ˜ํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์„ยท๋ฐ•์‚ฌ ์žฌํ•™ ์ค‘์— DeepSeek์—์„œ ์ธํ„ด์œผ๋กœ ํ™œ์•ฝํ•˜๋ฉด์„œ ์ฃผ์š” ์—ฐ๊ตฌ ์„ฑ๊ณผ(๋…ผ๋ฌธ, ์‹ ๊ทœ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋“ฑ)๋ฅผ ๋‚ธ ์‚ฌ๋ก€๊ฐ€ ๋‹ค์ˆ˜ ์†Œ๊ฐœ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ) MLA(Multi-head Latent Attention) ์ œ์•ˆ์ž ์ค‘ ํ•œ ๋ช…์ธ ้ซ˜ๅŽไฝ(๊ฐ€์˜คํ™”์ญˆ์–ด): ๋ฒ ์ด์ง•๋Œ€ ๋ฌผ๋ฆฌํ•™๊ณผ. ๆ›พๆ—บไธ(์ฉก์™•๋”ฉ): ๋ถ๊ฒฝ์šฐ์ „๋Œ€(ๅŒ—้‚ฎ) ์ถœ์‹ , โ€œMLAโ€ ์ฃผ ์—ฐ๊ตฌ์ž. ้‚ตๆ™บๅฎ(์ƒค์˜ค์ฆˆํ›™): ์นญํ™”๋Œ€ CoAI ์—ฐ๊ตฌ๊ทธ๋ฃน์˜ ๋ฐ•์‚ฌ ๊ณผ์ •, Microsoft Research ์ธํ„ด ๊ฒฝํ—˜. ๆœฑ็ช่ฑช(์ฃผ์น˜ํ•˜์˜ค): ๋ฒ ์ด์ง•๋Œ€ ์†Œํ”„ํŠธ์›จ์–ด ์—ฐ๊ตฌ์†Œ ๋ฐ•์‚ฌ ๊ณผ์ •, ๋‹ค์ˆ˜์˜ ์ตœ๊ณ ๊ธ‰ ํ•™์ˆ ๋Œ€ํšŒ(ASE, ESEC/FSE) ์ˆ˜์ƒ ๊ฒฝ๋ ฅ. ไปฃ่พพๅŠข(๋‹ค์ด๋‹ค๋งˆ์ด), ็Ž‹็‚ณๅฎฃ(์™•๋น™์‰ฌ์•ˆ), ่ตตๆˆ้’ข(์ž์˜ค์ฒญ๊ฐ•) ๋“ฑ๋„ ๊ฐ๊ฐ ๋ฒ ์ด์ง•๋Œ€, ์นญํ™”๋Œ€์—์„œ ์ปดํ“จํ„ฐ๋‚˜ ์ˆ˜ํ•™ยท๋ฌผ๋ฆฌยท์ •๋ณดํ•™ ๋“ฑ์— ์ข…์‚ฌ. ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์™€ ์ Š์€ ๋ฆฌ๋” ํŒ€ ๋ฆฌ๋”๊ธ‰๋„ ๋ฐ•์‚ฌ ์กธ์—… ํ›„ 4~6๋…„ ์ฐจ ์ˆ˜์ค€์ธ ์ Š์€ ๊ตฌ์„ฑ์›์ด ๋งŽ์Šต๋‹ˆ๋‹ค. ํ•˜๋“œ์›จ์–ด, ์‹œ์Šคํ…œ ์ธํ”„๋ผ ์ตœ์ ํ™” ์ชฝ์—๋„ ์—”๋น„๋””์•„, ์•Œ๋ฆฌํด๋ผ์šฐ๋“œ ๋“ฑ์—์„œ ๊ฒฝํ—˜์„ ์Œ“์€ ์ Š์€ ์—”์ง€๋‹ˆ์–ด๋“ค์ด ํฌ์ง„ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํ›„์ฒ˜๋ฆฌ(ํ›„๊ณต์ •)๋‚˜ ๋ชจ๋ธ ํŒŒ์ธํŠœ๋‹ ํŒ€์„ ์ด๋„๋Š” ๅดไฟฃ(์šฐ์œ„) ๊ฐ™์€ ๊ฒฝ์šฐ, ๋ถํ•ญ(ๅŒ—่ˆช) ๋ฐ•์‚ฌ ์กธ์—… ํ›„ MSRA(๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ ์•„์‹œ์•„์—ฐ๊ตฌ์›)์—์„œ ์—ฐ๊ตฌํ–ˆ์œผ๋ฉฐ, DeepSeek ํ•ฉ๋ฅ˜ ์ดํ›„ ๋Œ€ํ˜• ๋ชจ๋ธ ํ›„์† ํ›ˆ๋ จ์„ ์ฃผ๋„ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์Šตยท์ธํ„ด์˜ ์ ๊ทน์  ๊ธฐ์—ฌ ๋ฐ•์‚ฌ ๊ณผ์ • ์ธํ„ด๋“ค์ด ๋…ผ๋ฌธ ๋ฐœํ‘œ, ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ์— ํ•ต์‹ฌ ๊ธฐ์—ฌ๋ฅผ ํ•˜๋Š” ์‚ฌ๋ก€๊ฐ€ ๋ˆˆ์— ๋„๋ฉฐ, ์ผ๋ถ€ ์ธํ„ด์€ ์งง์€ ๊ธฐ๊ฐ„ ์—ฐ๊ตฌ๋กœ๋„ ์ค‘์š”ํ•œ ๊ธฐ๋Šฅ์„ ๋งŒ๋“ค์–ด๋ƒ…๋‹ˆ๋‹ค. ์˜ˆ) ๅญ™ๆ™ฏ็ฟ”(์ˆœ์ง•์ƒน)์€ 3D ์ƒ์„ฑ ๊ด€๋ จ ์—ฐ๊ตฌ๋ฅผ, ่พ›ๅŽๅ‰‘(์‹ ํ™”์  )์€ ์ˆ˜ํ•™ ์ •๋ฆฌ ์ฆ๋ช…(DeepSeek-Prover) ๊ด€๋ จ ์ผ์„ ๋‹ด๋‹นํ–ˆ๋‹ค๊ฐ€ ๊ฐ๊ฐ ํ•ด์™ธ ๋Œ€ํ•™(์˜ˆ: ์—๋“ ๋ฒ„๋Ÿฌ๋Œ€)์œผ๋กœ ์œ ํ•™์„ ๊ฐ€๊ธฐ๋„ ํ•จ. 2. ํŒ€์ด ์–ด๋–ป๊ฒŒ ์ผํ•˜๋Š”๊ฐ€? โ€œ์ด๋ฆ„๋งŒ ์žˆ์ง€ ์•Š์€โ€ ์ž์œจ ๋ถ„์—… DeepSeek ์ฐฝ์—…์ž์ด์ž ๋Œ€ํ‘œ์ธ ๆขๆ–‡้”‹(๋Ÿ‰์›ํŽ‘)์€ โ€œ๊ฒฝํ—˜๋ณด๋‹ค๋Š” ์‹ค๋ ฅ์„, ์กฐ์ง๋ณด๋‹ค๋Š” ์—ด์ •์  ํ˜‘์—…์„ ์ค‘์‹œํ•œ๋‹คโ€๋Š” ์ธ์žฌ ์ฒ ํ•™์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ์ธ์œ„์ ์ธ ๋ถ€์„œ ๊ตฌ๋ถ„์„ ์ตœ์†Œํ™”ํ•˜๋ฉฐ, ๋ˆ„๊ฐ€ ์–ด๋–ค ์—ฐ๊ตฌ๋ฅผ ํ•˜๊ณ  ์‹ถ์œผ๋ฉด ํ•„์š”ํ•œ GPUยท์ปดํ“จํŒ… ์ž์›์„ ์ž์œ ๋กญ๊ฒŒ ์š”์ฒญยทํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ช‡๋ช‡ ์‚ฌ๋žŒ์ด ๋ชจ์—ฌ์„œ ์•„์ด๋””์–ด๊ฐ€ ๋– ์˜ค๋ฅด๋ฉด ์Šน์ธ ์ ˆ์ฐจ ์—†์ด ํ”„๋กœ์ ํŠธ๋ฅผ ์‹œ์ž‘ํ•˜๊ณ , ์ž ์žฌ๋ ฅ์ด ๋ณด์ด๋ฉด ํšŒ์‚ฌ ์ „์ฒด๊ฐ€ ๋ฆฌ์†Œ์Šค๋ฅผ ๋ชฐ์•„์ค„ ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ์‹์˜ ์ƒํ–ฅ์‹ ํ˜์‹  ๊ตฌ์กฐ๋ฅผ ์ทจํ•ฉ๋‹ˆ๋‹ค. ๋Œ€ํ•™์ƒยท๋ฐ•์‚ฌ๊ณผ์ •ยท์กธ์—… 1~2๋…„์ฐจ ์ธ๋ ฅ์ด ์ฃผ์ถ•์ด ๋˜๊ณ , ๊ฒฝ๋ ฅ๋ณด๋‹ค๋Š” ์—ฐ๊ตฌ ์—ญ๋Ÿ‰์ด๋‚˜ ์„ฑ์ทจ๋ฅผ ์šฐ์„ ์‹œํ•˜๋Š” ์ .

AI ์ชฝ์—์„œ๋Š” ์š”์ฆ˜ ๋†€๋ผ์šธ ์ •๋„๋กœ DeepSeek์— ๋Œ€ํ•œ ์ด์•ผ๊ธฐ ๋ฐ–์— ์—†๋‹ค. (์†”์งํžˆ ๋‚˜๋„ ์š”์ฆ˜ ๋„ˆ๋ฌด ๋งŽ์€ ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๊ณ  ์žˆ๊ธด ํ•˜์ง€๋งŒ, ์ง€๊ธˆ๋งŒ ๊ทธ๋žฌ๋˜ ๊ฒƒ์€ ์•„๋‹ˆ๊ณ  ๋Š˜ ๋งŽ์ด ํ–ˆ๋˜ ๊ฒƒ์ด๋‹ˆ ์šฉ์„œํ•ด์ฃผ์‹œ๊ธฐ๋ฅผ.) ๊ทธ๋ฆฌ๊ณ  ์ƒ๊ฐ๋ณด๋‹ค ๋งŽ์€ ํ™”์ œ๊ฐ€ DeepSeek์˜ ์„ฑ๊ณผ๋ฅผ ํ‰๊ฐ€์ ˆํ•˜ํ•˜๋ ค๋Š” ๊ฒƒ๊ณผ ๊ด€๋ จ์ด ์žˆ๋Š” ๋“ฏ ํ•˜๋‹ค. ChatGPT๋กœ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•œ ๊ฒƒ์ด๋‹ค, ์ €์ž‘๊ถŒ์ด๋‚˜ ํ”„๋ผ์ด๋ฒ„์‹œ์™€ ๊ด€๊ณ„ ์—†์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ€๋Šฅํ–ˆ๋‹ค, ์ค‘๊ตญ ์ •๋ถ€์˜ ์ง€์›์„ ๋ฐ›์•˜๋‹ค, ์‹ค์ œ๋กœ๋Š” GPU๋ฅผ ๋” ๋งŽ์ด ์‚ฌ์šฉํ–ˆ๋‹ค, ๊ทธ๋ฆฌ๊ณ  ๊ฒ€์—ด๊ณผ ๊ด€๋ จ๋œ ๋ฌธ์ œ ๋“ฑ. ChatGPT๋กœ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๊ฒƒ ๊ฐ™์ง€๋Š” ์•Š๋‹ค. ํฌ์ŠคํŠธํŠธ๋ ˆ์ด๋‹์— ChatGPT ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์“ฐ๋Š” ๊ฒƒ์€ ๋„ˆ๋ฌด๋‚˜ ํ”ํ•œ ์ผ์ด์ง€๋งŒ (์‚ฌ์‹ค ์ค‘๊ตญ์— ๊ตญํ•œ๋œ ๊ฒƒ์€ ์•„๋‹ˆ๊ณ  ๋ฏธ๊ตญ์—์„œ๋„ ๋งŽ์ด ์ผ์–ด๋‚˜๋Š” ์ผ์ด๋‹ค) DeepSeek์ด ๊ทธ๋žฌ๋‹ค๋Š” ์ฆ๊ฑฐ๋Š” ์—†๋‹ค. ํŠนํžˆ ๋‹ค๋ฅธ ์ค‘๊ตญ ๋ชจ๋ธ๊ณผ๋Š” ๋‹ฌ๋ฆฌ ํ”„๋ฆฌํŠธ๋ ˆ์ด๋‹์— Instruction ๋ฐ์ดํ„ฐ๋ฅผ ์“ฐ๋Š” ๊ฒƒ์— ์กฐ์‹ฌ์Šค๋Ÿฌ์› ๋˜ ํŽธ์ด๋ผ ๋”๋”์šฑ. (ํฌ์ŠคํŠธํŠธ๋ ˆ์ด๋‹์— ๋Œ€ํ•ด ์ง„์ •์œผ๋กœ ๊ด€์‹ฌ์ด ์žˆ๋‹ค๋ฉด ๋‹ค๋ฅธ ๋ชจ๋ธ์˜ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์“ฐ์ง€ ์•Š๋Š” ๊ฒƒ์ด ๋งž๋Š” ๋ฐฉํ–ฅ์ด๊ธฐ๋„ ํ•˜๋‹ค.) ์ €์ž‘๊ถŒ์ด๋‚˜ ํ”„๋ผ์ด๋ฒ„์‹œ์™€ ๊ด€๊ณ„ ์—†์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ–ˆ์„ ๊ฒƒ์ด๋ผ๋Š” ๋ถ€๋ถ„์—์„œ๋„ ๋”ฑํžˆ ์ฆ๊ฑฐ๊ฐ€ ์žˆ์„์ง€๋Š” ๋ชจ๋ฅด๊ฒ ๋‹ค. ์‚ฌ์šฉ์ž ๋ฐ์ดํ„ฐ๋Š” ์‚ฌ๋žŒ๋“ค์˜ ์ƒ๊ฐ์ฒ˜๋Ÿผ ํ”„๋ฆฌํŠธ๋ ˆ์ด๋‹์— ํฐ ๋„์›€์ด ๋  ์ข…๋ฅ˜์˜ ๊ฒƒ์€ ์•„๋‹ˆ๊ณ  ์ €์ž‘๊ถŒ์ด ์• ๋งคํ•œ ๋ฐ์ดํ„ฐ์˜ ์‚ฌ์šฉ์€ ๊ฐ€๋Šฅํ•˜๊ฒ ์ง€๋งŒ ๋ฏธ๊ตญ ๊ธฐ์—…๋“ค๋„ ์ด๋Ÿฐ ์˜ํ˜น์—์„œ๋Š” ์ž์œ ๋กญ์ง€ ์•Š๋‹ค. ์ตœ๊ทผ ๋ฉ”ํƒ€๊ฐ€ Library Genesis์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ–ˆ๋‹ค๋Š” ์˜ํ˜น์„ ์ƒ๊ฐํ•ด๋ณด๋ฉด. (์ด๋Ÿฐ ์ด์•ผ๊ธฐ๋Š” GPT-3์— ์‚ฌ์šฉ๋œ ์ •์ฒด๋ถˆ๋ช…์˜ Book2 ๋ฐ์ดํ„ฐ์—์„œ๋ถ€ํ„ฐ ์žˆ์—ˆ๋‹ค.) ํ•œ ๊ฐ€์ง€ ์žˆ๋‹ค๋ฉด ์ค‘๊ตญ์˜ ํ์‡„์ ์ธ ์›น์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์— ์šฉ์ดํ•˜๊ฒŒ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์—ˆ์„ ๊ฒƒ์ด๋ผ๋Š” ๊ฒƒ ์ •๋„์ผ ๋“ฏ. (DeepSeek V2 ์‹œ์ ์— ์ค‘๊ตญ์–ด ๋ฐ์ดํ„ฐ๊ฐ€ ์˜์–ด ๋ฐ์ดํ„ฐ๋ณด๋‹ค ๋งŽ์•˜๋‹ค๋Š” ์–ธ๊ธ‰์„ ํ•œ ๊ฒƒ์ด ์žˆ๋‹ค.) ์ค‘๊ตญ ์ •๋ถ€์˜ ์ง€์›์„ ๋ฐ›๋Š”๋‹ค๋Š” ๊ฒƒ์—์„œ๋Š” Alibaba์™€ Qwen ๊ฐ™์€ ๊ธฐ์—…๋“ค์— ๋น„ํ•ด์„œ DeepSeek๊ณผ High Flyer๋Š” ์ง€์›์„ ๋ฐ›๋Š”๋‹ค๊ณ  ํ•ด๋„ ํ›„์ˆœ์œ„๊ฐ€ ์•„๋‹๊นŒ ์‹ถ๋‹ค. GPU๋ฅผ ๋” ๋งŽ์ด ์‚ฌ์šฉํ–ˆ๋‹ค๋Š” ๊ฒƒ์€ ๋‹น์—ฐํžˆ ๋งž์„ ๊ฒƒ์ด๋‹ค. ์ผ๋‹จ ์ด์ „์— ๊ณต๊ฐœ๋œ ๊ฒƒ์œผ๋กœ๋„ A100์„ 1๋งŒ ๊ฐœ ๊ทœ๋ชจ๋กœ ๊ฐ–๊ณ  ์žˆ์—ˆ๊ณ , Hopper ์‹œ๋ฆฌ์ฆˆ๋„ (Dylan Patel์ด ์ฃผ์žฅํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ 5๋งŒ ๊ฐœ ๊ทœ๋ชจ์ผ์ง€๋Š” ๋ชจ๋ฅด๊ฒ ์ง€๋งŒ) ์•„๋งˆ 2์ฒœ ๊ฐœ ๊ทœ๋ชจ๋ณด๋‹ค๋Š” ๋งŽ์ด ๊ฐ–๊ณ  ์žˆ์„ ๋“ฏ ์‹ถ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ DeepSeek V3 ํ•™์Šต์— ๋…ผ๋ฌธ์—์„œ ์ฃผ์žฅํ•˜๋Š” 2์ฒœ ๊ฐœ๋ณด๋‹ค ๋งŽ์€ GPU๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๊ฒƒ์ด๋ผ๋Š” ์ฆ๊ฑฐ๋Š” ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋งŽ์€ ์‹คํ—˜, ๊ทธ๋ฆฌ๊ณ  DeepSeek V3๊ฐ€ ์žˆ๊ธฐ๊นŒ์ง€ ์ง€์†ํ•ด์˜จ ์—ฐ๊ตฌ๋“ค์„ ์ƒ๊ฐํ•˜๋ฉด ๋‹น์—ฐํžˆ ๋ชจ๋ธ ๊ตฌ์ถ•์— ํˆฌ์ž…๋œ ์ด ์—ฐ์‚ฐ๋ ฅ์€ ๊ทธ๋ณด๋‹ค๋Š” ๋งŽ์„ ์ˆ˜๋ฐ–์— ์—†๋‹ค. ๊ฒ€์—ด์— ๋Œ€ํ•ด์„œ๋Š” DeepSeek V2์—์„œ๋ถ€ํ„ฐ "๋ฌธํ™”์ ์ธ ์ฐจ์ด"๋ฅผ ์–ธ๊ธ‰ํ•˜๊ณ  ์žˆ์œผ๋ฏ€๋กœ ํ•œ๊ณ„๊ฐ€ ์žˆ์„ ์ˆ˜๋ฐ–์— ์—†์ง€๋งŒ, ๊ธฐ์ˆ ์ ์ธ ์„ฑ๊ณผ๋ฅผ ๋…ผํ•จ์— ์žˆ์–ด ๊ทธ๋ ‡๊ฒŒ ์ค‘์š”ํ•œ ์š”์ธ์ด๋ผ๋Š” ์ƒ๊ฐ์€ ๋“ค์ง€ ์•Š๋Š”๋‹ค. DeepSeek์„ ๊ตณ์ด ๋ณ€ํ˜ธํ•  ์ด์œ ๋Š” ์—†์ง€๋งŒ ๊ธฐ์ˆ ์  ์„ฑ์ทจ์— ๋Œ€ํ•ด์„œ๋Š” ์ •ํ™•ํ•˜๊ฒŒ ํ‰๊ฐ€ํ•˜๋Š” ์ชฝ์ด ๊ทธ๋Ÿฌ์ง€ ์•Š๋Š” ๊ฒƒ๋ณด๋‹ค๋Š” ๋‚˜์„ ๊ฒƒ์ด๋‹ค. ์‚ฌ์‹ค DeepSeek์—์„œ ์ง€๊ธˆ๊นŒ์ง€ ๋‚˜์˜จ ์—ฐ๊ตฌ์  ๊ฒฐ๊ณผ๋“ค์„ ์•Œ๊ณ  ์žˆ๋Š” ์‚ฌ๋žŒ๋“ค์—๊ฒŒ๋Š” ์ƒˆ์‚ผ์Šค๋Ÿฝ๊ฒŒ ์ง€๊ธˆ ๋†€๋ผ๋Š” ์‚ฌ๋žŒ๋“ค์˜ ๋ฐ˜์‘์ด๋‚˜ ํ‰๊ฐ€์ ˆํ•˜ํ•˜๊ณ ์ž ํ•˜๋Š” ๋™๊ธฐ๋“ค์ด ์ƒ๊ฒฝํ•œ ๊ฒƒ์ผ ๊ฒƒ์ด๋‹ค. ๋‚ด ์†Œ๊ฐ์— ๋Œ€ํ•ด์„œ ๋งํ•˜์ž๋ฉด. ํ•œ๊ตญ์—์„œ๋„ ์ œ๋Œ€๋กœ ์‹œ๋„ํ–ˆ๋‹ค๋ฉด ์ข‹์€ ์„ฑ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค๋Š” ์ฆ๊ฑฐ์ธ ๊ฒƒ ๊ฐ™๋‹ค๋Š” ์ƒ๊ฐ์„ ํ•œ๋‹ค. ๋ฌผ๋ก  ์œ„์—๋„ ์ผ์ง€๋งŒ ์ตœ์ข… DeepSeek V3 ๋ชจ๋ธ ํ•™์Šต์— ์‚ฌ์šฉํ•œ ๋น„์šฉ์ด ๋ชจ๋ธ ๊ตฌ์ถ• ๋น„์šฉ์˜ ์ „๋ถ€๋ผ๋Š” ๊ฒƒ์€ ์˜ณ์ง€ ์•Š๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ทธ ๋น„์šฉ์ด OpenAI, ๊ตฌ๊ธ€, ๋ฉ”ํƒ€, Anthropic ๋“ฑ์—์„œ ์“ฐ๋Š” ๋น„์šฉ๋ณด๋‹ค๋Š” ํ›จ์”ฌ ์ ์„ ๊ฒƒ์ด๋ผ๋Š” ๊ฒƒ๋„ ์•„๋งˆ ๋งž์„ ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฐ ์ •๋„์˜ ์ž์›์ด ํ—ˆ๋ฝํ•˜๋Š” ์•ˆ์—์„œ ํ•„์š”ํ•œ ์ž‘์—…๋“ค์„ ์ •ํ™•ํžˆ ํ•ด๋‚ธ๋‹ค๋ฉด ์„ฑ๊ณผ๋ฅผ ๋‚ด์ง€ ๋ชปํ•  ์ด์œ ๋Š” ์—†๋‹ค. ์ด๊ฒƒ์— DeepSeek์˜ ๊ธฐ์ˆ ์  ์„ฑ๊ณผ๋‚˜ ์ˆ˜์ค€์„ ํ„ํ•˜ํ•˜๋ ค๋Š” ์˜๋„๋Š” ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‚˜๋Š” ๊ฐœ์ธ์˜ ๋Šฅ๋ ฅ๊ณผ ๊ธฐ์ˆ  ์ด์ƒ์œผ๋กœ ํ•„์š”ํ•œ ์ž‘์—…๋“ค์„ ๊ตฌ๋ถ„ํ•˜๊ณ  ๊ทธ๊ฒƒ์„ ์‹คํ–‰ํ•˜๋Š” ๊ฒƒ ์ž์ฒด์— ๋” ์ค‘๋Œ€ํ•จ์ด ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ๊ทธ ์ž‘์—…๋“ค์„ ์ •ํ™•ํ•˜๊ฒŒ ํ•ด๋‚ด๋Š” ๊ฒƒ์—๋Š” ๊ธฐ์ˆ ๊ณผ ๋Šฅ๋ ฅ์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ๊ทธ์ค‘์—๋„ ์„ฑ์‹คํ•จ์œผ๋กœ ์ฑ„์šธ ์ˆ˜ ์žˆ๋Š” ์ถฉ๋ถ„ํžˆ ๋ถ€๋ถ„์ด ์žˆ์„ ๊ฒƒ์ด๋‹ค. ์‚ฌ์‹ค ํ•„์š”ํ•œ ์ž‘์—…๋“ค์„ ํŒ๋‹จํ•˜๊ณ  ๊ทธ๊ฒƒ์— ์˜จ๋‹นํ•œ ์ž์›์„ ํˆฌ์ž…ํ•˜๋Š” ๊ฒƒ์ด ๊ณง ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๋Šฅ๋ ฅ์ธ ๊ฒƒ์ผ ์ˆ˜๋„ ์žˆ๋‹ค. ๊ทธ๋Ÿฐ ์˜๋ฏธ์—์„œ ๊ฐœ์ธ์˜ ํƒ์›”ํ•จ์ด๋ž€ ์ฃผ์–ด์ง„ ์ž‘์—…์— ๋Œ€ํ•œ ์„ฑ๊ณผ๋ณด๋‹ค๋Š” ์–ด๋– ํ•œ ์ž‘์—…์„ ์„ ํƒํ•˜๋Š”๊ฐ€ ํ•˜๋Š” ์ง€์ ์— ์žˆ๋Š”์ง€๋„ ๋ชจ๋ฅด๊ฒ ๋‹ค. ๋”ฐ๋ผ์„œ ์ธ๋ ฅ์˜ ์ˆ˜์ค€, ๊ทœ๋ชจ, ํ˜น์€ ์‹œ๊ฐ„ ๋“ฑ์˜ ์š”์ธ ์ด์ „์— ์ง€๊ธˆ๊นŒ์ง€ ํ•ด์˜จ ์„ ํƒ๊ณผ ํŒ๋‹จ ๊ธฐ์ค€์— ๋Œ€ํ•ด ์ˆ™๊ณ ํ•˜๋Š” ๊ฒƒ์ด ํ•„์š”ํ•  ์ˆ˜๋„ ์žˆ๋‹ค. ์ข‹์€ ํŒ๋‹จ ๋˜๋Š” ๋ฌด์—‡์ด ์˜ฌ๋ฐ”๋ฅธ ๋ฐฉ๋ฒ•์ธ์ง€๋ฅผ ์•„๋Š” ๊ฒƒ์€ ์ธ๋ ฅ๊ณผ ์ž์›์ด ๋ถ€์กฑํ•˜๋”๋ผ๋„ ๊ฐ–์ถœ ์ˆ˜ ์žˆ๋‹ค. ์ด์— ๋Œ€ํ•ด ๋‹ตํ•  ์ˆ˜ ์žˆ์–ด์•ผ ์ž์›์˜ ์ œ์•ฝ์ด ์—†๋Š” ์ƒํ™ฉ์—์„œ๋„ ์ข‹์€ ์„ ํƒ์„ ํ•  ์ˆ˜ ์žˆ์—ˆ์œผ๋ฆฌ๋ผ๊ณ  ํ™•์‹ ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ž์›์€ ์–ผ๋งˆ๋“ ์ง€ ๋‚ญ๋น„ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋ฏ€๋กœ. ์ด ๋ฌธ์ œ์— ๋Œ€ํ•ด ์ธ๋ ฅ์˜ ๊ทœ๋ชจ๋‚˜ ์‹œ๊ฐ„ ๊ฐ™์€ ์–‘์ ์ธ ์ธก๋ฉด๋“ค์€ ์ƒ๊ฐ๋ณด๋‹ค ์ฐจ์ˆœ์œ„์ผ์ง€๋„ ๋ชจ๋ฅธ๋‹ค. ๊น€์„ฑํ˜„๋‹˜

https://youtu.be/snkOMOjiVOk ์ถ”๋ก ์ด๋ผ๊ณ  ๋ถ€๋ฅผ ์ˆ˜๋„ Inference time Scaling์ด๋ผ๊ณ  ๋ถ€๋ฅผ ์ˆ˜๋„ ์žˆ๊ฒ ์ง€๋งŒ ๋ณธ์งˆ์ ์œผ๋กœ๋Š” ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋Œ€๊ทœ๋ชจ RL์„ ํ–ˆ์„ ๋•Œ ๋‚˜ํƒ€๋‚˜๋Š” ์ฐฝ๋ฐœ์ ์ธ ํ˜„์ƒ์ด๋ผ๋Š” ๊ฒƒ. ๊ณผ์ •์ด ์–ด๋– ํ•ด์•ผ ํ•˜๋Š”๊ฐ€๋ฅผ ๊ธฐ์ˆ ํ•˜๋Š” ๋Œ€์‹  ๋ชจ๋ธ์ด ๊ทธ๊ฒƒ์„ ์Šค์Šค๋กœ ์ฐพ๊ฒŒ ํ•ด์•ผ ํ•œ๋‹ค๋Š” ๋”ฅ ๋Ÿฌ๋‹์˜ ์‚ฌ๊ณ ๋ฐฉ์‹์œผ๋กœ ๋‹ค์‹œ ๋Œ์•„๊ฐ€์•ผ ํ•˜๋Š” ์ˆœ๊ฐ„. ๊น€์„ฑํ˜„๋‹˜ ์ถ”๋ก (Reasoning) ๋ชจ๋ธ, RL ์ ‘๋ชฉ ์ „๋ง ํƒ€์‚ฌ ๋ชจ๋ธ(์˜ˆ: OpenAI)๊ณผ์˜ ๋น„๊ต ์งˆ๋ฌธ์ž๋Š” โ€œOpenAI์—์„œ ๋ชจ๋ธ๋ณ„๋กœ Reasoning ๋ชจ๋“œ๊ฐ€ ์กด์žฌํ•œ๋‹ค๋Š”๋ฐ, Anthropic์—๋„ ๋น„์Šทํ•œ ๋ชจ๋ธ์ด ์žˆ๋ƒโ€๊ณ  ์งˆ๋ฌธ. ํ™”์ž๋Š” Anthropic ์ธก ์ ‘๊ทผ์€ โ€œ์ด๋ถ„๋ฒ•์ ์œผ๋กœ ์ถ”๋ก  ๋ชจ๋ธ vs. ์ผ๋ฐ˜ ๋ชจ๋ธโ€๋กœ ๊ตฌ๋ถ„ํ•˜๊ธฐ๋ณด๋‹ค, RL(๊ฐ•ํ™”ํ•™์Šต)์„ ํ†ตํ•ด ๋ชจ๋ธ์ด ๋” ๊นŠ๊ฒŒ ์‚ฌ๊ณ ยท๋ฐ˜์„ฑ(reflection)ยทํƒ์ƒ‰(search)ํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๋ฐฉํ–ฅ์ด๋ผ ์„ค๋ช…. ๊ฒฐ๋ก ์ ์œผ๋กœ โ€˜์ƒ๊ฐํ•˜๋Š” ๋ชจ๋ธโ€™๊ณผ โ€˜๊ทธ๋ƒฅ ๋น ๋ฅด๊ฒŒ ๋‹ต๋ณ€ํ•˜๋Š” ๋ชจ๋ธโ€™์„ ๋ณ„๋„๋กœ ๋‘๊ธฐ๋ณด๋‹ค, ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ชจ๋ธ์ด ์ƒํ™ฉ์— ๋”ฐ๋ผ ์†์‰ฝ๊ฒŒ ์ถ”๋ก ํ•˜๋Š” ์ชฝ์„ ์ง€ํ–ฅ. ๊ฐ•ํ™”ํ•™์Šต(RL) ๋Œ€๊ทœ๋ชจ ๋„์ž… Anthropic์€ ์•ž์œผ๋กœ ์ ์  ๋” ๋งŽ์€ RL ๊ธฐ๋ฒ•์„ ๋ชจ๋ธ ํ•™์Šต์— ํ™œ์šฉํ•  ๊ฒƒ์ด๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์ด โ€œ์Šค์Šค๋กœ ์‚ฌ๊ณ  ๊ณผ์ •์„ ์ ๊ฒ€โ€ํ•˜๊ณ  ํ’ˆ์งˆ ๋†’์€ ๋‹ต๋ณ€์„ ๋„์ถœํ•˜๊ฒŒ ๋งŒ๋“ค ๊ฒƒ. โ€œํ…Œ์ŠคํŠธ ์‹œ๊ฐ„(Test-Time) ์ปดํ“จํŠธโ€ ํ˜น์€ โ€œ์ถ”๋ก  ์‹œ๊ฐ„ ์„ค๊ณ„โ€์— ๋Œ€ํ•œ ๋…ผ์˜๊ฐ€ ์žˆ์ง€๋งŒ, Anthropic์€ โ€œ๊ฒฐ๊ตญ ๋Œ€๊ทœ๋ชจ RL ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ ์Šค์Šค๋กœ ์‚ฌ๊ณ ๋ฅผ ๊ฐ•ํ™”โ€ํ•˜๋Š” ๋ฐฉ์‹์ด ๋” ์ž์—ฐ์Šค๋Ÿฝ๋‹ค๊ณ  ๋ด„. 2017~2018๋…„ ์ดํ›„ Scaling Laws ๊ด€์ฐฐ ํ™”์ž๋Š” ์ด๋ฏธ 2017๋…„ ๋ฌด๋ ต๋ถ€ํ„ฐ โ€œ๊ณ„์‚ฐ ์ž์›์„ ๊ณ„์† ๋Š˜๋ฆฌ๋ฉด ๋ชจ๋ธ ์„ฑ๋Šฅ์ด ์ „๋ฐฉ์œ„๋กœ ํ–ฅ์ƒ๋œ๋‹คโ€๋ผ๋Š” ์Šค์ผ€์ผ๋ง ๋ฒ•์น™์„ ๋ฏฟ์–ด ์™”์Œ. ๊ณผ๊ฑฐ์—๋Š” ์ผ์ • ์ˆ˜์ค€ ๋ถˆํ™•์‹ค์„ฑ์ด ์žˆ์—ˆ์œผ๋‚˜, ์ตœ๊ทผ 3~6๊ฐœ์›” ์‚ฌ์ด ๊ทธ ๋ถˆํ™•์‹ค์„ฑ์ด ํฌ๊ฒŒ ์ค„์—ˆ๊ณ , ์‹ค์ œ๋กœ ์—ฌ๋Ÿฌ ์ง€ํ‘œ์—์„œ ๋ชจ๋ธ์ด ์‚ฌ๋žŒ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ๋‹จ๊ณ„๊ฐ€ ๊ฐ€๊นŒ์›Œ์ง€๊ณ  ์žˆ๋‹ค๊ณ  ์ง„๋‹จ. โ€œAI ๋ฐœ์ „์ด ์ƒ๊ฐ๋ณด๋‹ค ๋น ๋ฅด๋‹คโ€ ํ™”์ž๋Š” AI ๋ฐœ์ „์ด ๊ทน๋„๋กœ ๋น ๋ฅด๋ฉฐ, ํ–ฅํ›„ 2~3๋…„ ๋‚ด์— ๊ฑฐ์˜ ๋ชจ๋“  ์ง€์‹ยทํŠน์ • ์ž‘์—…์—์„œ ์ธ๊ฐ„๋ณด๋‹ค ์šฐ์›”ํ•ด์งˆ ๋ชจ๋ธ์ด ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋‹ค๊ณ  ์„ค๋ช…. ์ด์— ๋Œ€ํ•œ ๊ธ์ •์  ํšจ๊ณผ์™€ ๋ถ€์ •์  ๋ฆฌ์Šคํฌ ๋ชจ๋‘๊ฐ€ ์ปธ๊ธฐ์—, โ€œAI ์—…๊ณ„๊ฐ€ ์ด๋ฅผ ์ œ๋Œ€๋กœ ์ธ์‹ํ•˜๊ณ  ์†”์งํžˆ ์†Œํ†ตํ•ด์•ผ ํ•œ๋‹คโ€๊ณ  ๊ฐ•์กฐ. ๋…ธ๋™์‹œ์žฅ ์˜ํ–ฅ (๋‹จ๊ธฐ vs ์žฅ๊ธฐ) ๋‹จ๊ธฐ์  ๊ด€์ (1~3๋…„ ์ •๋„) ์ƒˆ๋กœ์šด ๊ธฐ์ˆ ์€ ๊ธฐ์กด ์ผ์ž๋ฆฌ๋ฅผ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ฐ˜๋Œ€๋กœ โ€œ๊ธฐ์ˆ  ํ™œ์šฉ ๋Šฅ๋ ฅ์ด ์žˆ๋Š” ์ธ๋ ฅโ€์˜ ์ƒ์‚ฐ์„ฑ์„ ํฌ๊ฒŒ ๋†’์—ฌ โ€˜๋ณด์™„์žฌ(Complementary)โ€™ ์—ญํ• ์„ ํ•  ์ˆ˜๋„ ์žˆ์Œ. Anthropic์€ ์ด์ „ ๊ธฐ์ˆ ํ˜์‹  ์‚ฌ๋ก€์ฒ˜๋Ÿผ, โ€œ์ง๋ฌด ์ผ๋ถ€๋ฅผ AI๊ฐ€ ๋Œ€์‹ ํ•˜๋ฉด, ์‚ฌ๋žŒ์ด ๋” ์ฐฝ์˜์ ยท๊ณ ์ฐจ์›์  ๋ถ€๋ถ„์— ์ง‘์ค‘ํ•ด ์—…๋ฌด ํšจ์œจ์„ ๋†’์ผ ์ˆ˜ ์žˆ๋‹คโ€๋Š” โ€˜๋น„๊ต์šฐ์œ„โ€™ ๊ด€์ ์„ ๊ฐ•์กฐ. ๋‹ค๋งŒ ๊ธฐ์—…๋“ค์ด AI๋ฅผ ์–ด๋–ป๊ฒŒ ๋„์ž…ํ•˜๋А๋ƒ(๋Œ€์ฒด vs. ๋ณด์™„)์— ๋”ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ€ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์œผ๋ฉฐ, Anthropic์€ โ€œ๋ณด์™„ํ˜• ํŒŒํŠธ๋„ˆ์‹ญโ€ ๋ฐฉํ–ฅ์„ ์ง€์ง€. ์žฅ๊ธฐ์  ๊ด€์  ํ™”์ž๋Š” โ€œ๊ฒฐ๊ตญ์—๋Š” AI๊ฐ€ ์ธ๊ฐ„๋ณด๋‹ค ๋” ๋›ฐ์–ด๋‚œ ๋‹จ๊ณ„, ์‹ฌ์ง€์–ด ๋กœ๋ด‡๊ณผ ๊ฒฐํ•ฉํ•ด ๋ฌผ๋ฆฌ ๋…ธ๋™๊นŒ์ง€ ๋Œ€์ฒดํ•˜๋Š” ์‹œ์ โ€์ด ์˜ฌ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ(์‹œ์  ๋ถˆ๋ช…, ๋‹ค๋งŒ 2027๋…„ ์ „ํ›„ ๊ฐ€๋Šฅ์„ฑ ์–ธ๊ธ‰). ๊ทธ๋•Œ๋Š” โ€œ์ธ๊ฐ„์˜ ์ž์กด๊ฐ, ๊ฐ€์น˜, ๊ฒฝ์ œ ์ฒด๊ณ„, ๋ถ„๋ฐฐ ๋ฐฉ์‹โ€ ๋“ฑ์— ๊ทผ๋ณธ์ ์ธ ์žฌ์„ค๊ณ„๊ฐ€ ํ•„์š”. ๋ชจ๋“  ์ธ๊ฐ„์—๊ฒŒ ์ ์šฉ๋˜๋Š” ์ƒํ™ฉ์ด๋ผ๋ฉด โ€œ์ „(ๅ…จ) ์ธ๋ฅ˜๊ฐ€ ๊ฐ™์€ ๋ฐฐ๋ฅผ ํƒ”๋‹ค๊ณ  ๋ณผ ์ˆ˜๋„ ์žˆ์ง€๋งŒ, ๋งŒ์ผ 30%๋งŒ ๋Œ€์ฒด๋˜๊ณ  70%๋Š” ๊ทธ๋Œ€๋กœ๋ผ๋ฉด ํฐ ์‚ฌํšŒ ๊ฐˆ๋“ฑ์ด ์ƒ๊ธธ ๊ฒƒโ€์ด๋ผ๊ณ  ์šฐ๋ ค.

1. ๋ชฉํ‘œ์™€ ์ „์ œ: ์„ฑ๋Šฅ์ด ์ตœ์šฐ์„ ์ด๋‹ค โ€œLong CoT(๊ธด ์ฒด์ธ ์˜ค๋ธŒ ์†ŒํŠธ)โ€๋ฅผ ํ™œ์šฉํ•œ LLM ๊ฐ•ํ™”ํ•™์Šต(RL)์œผ๋กœ ๋” ๋†’์€ ๋ฌธ์ œ ํ•ด๊ฒฐ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ณ ์ž ํ•จ. ๋น„์šฉ๊ณผ ์†๋„(ํ† ํฐ ์‚ฌ์šฉ ์ฆ๊ฐ€ ๋“ฑ)๋Š” ๊ถ๊ทน์ ์œผ๋กœ ๋ฌด์–ด์˜ ๋ฒ•์น™ ๋“ฑ์œผ๋กœ ํ•ด๊ฒฐ ๊ฐ€๋Šฅํ•˜๋ฏ€๋กœ, โ€œ์šฐ์„  ์„ฑ๋Šฅ์„ ์ตœ๊ณ ๋กœ ๋Œ์–ด์˜ฌ๋ฆฐ๋‹คโ€๊ฐ€ ์ตœ์ƒ์œ„ ์›์น™. 2. ๋ฌธ์ œ์˜ ๊ทผ๋ณธ ๊ตฌ์กฐ ํŒŒ์•… ๊ธฐ์กด ์งง์€ ์ถ”๋ก (CoT)๋ณด๋‹ค ๊ธด ์ถ”๋ก (Long CoT)์ด ํ•„์š” โ†’ โ€œ์ž์œ ๋กญ๊ฒŒ ์ƒ๊ฐํ•˜๋Š” ๊ณผ์ •์„ ๋ชจ๋ธ์—๊ฒŒ ๋งก๊ธฐ๋˜, ์ •๋‹ต์„ ์ œ๋Œ€๋กœ ๋งž์ถ”๋Š”์ง€ ์—ฌ๋ถ€๋งŒ ๋ช…ํ™•ํžˆ ํŒ๋‹จโ€ํ•œ๋‹ค๋Š” ์ ์ด ํ•ต์‹ฌ. ๋ช…ํ™•ํ•œ ์ •๋‹ต์ด ์ œ๊ณต๋˜๋Š”(๋˜๋Š” ์ •ํ™•ํžˆ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ) ๊ณผ์ œ(์˜ˆ: ์ˆ˜ํ•™, ์ฝ”๋”ฉ ๋“ฑ)์—์„œ RL์„ ์ ์šฉํ•ด์•ผ ์˜ฌ๋ฐ”๋ฅธ ๋ณด์ƒ์„ ์ค„ ์ˆ˜ ์žˆ์Œ. ๋ชจ๋ธ์ด ์Šค์Šค๋กœ โ€œ๊ฒ€์ƒ‰(Search) ๊ณผ์ •โ€์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•ด์•ผ ํ•˜๋ฉฐ, ์ธ์œ„์ ์œผ๋กœ โ€œMCTS๋‚˜ Agentic ๊ตฌ์กฐโ€ ๊ฐ™์€ ์—„๊ฒฉํ•œ ํ‹€์„ ๊ฐ•์ œํ•˜๋ฉด ์˜คํžˆ๋ ค ๋ชจ๋ธ ์—ญ๋Ÿ‰์„ ์ œํ•œํ•จ. 3. ๊ทผ๋ณธ ํ•ด๋ฒ•: In-Context RL + Exploration ๊ธธ๊ณ  ์ž์œ ๋กœ์šด ์‚ฌ๊ณ  ๊ณผ์ •์„ โ€œํ•œ ๋ฒˆ์˜ ๋ฉ”์‹œ์ง€(ํ˜น์€ ๋ฌธ๋งฅ)โ€ ์•ˆ์— ๋‹ด์•„, ๊ณง๋ฐ”๋กœ ๋ณด์ƒ์„ ํ”ผ๋“œ๋ฐฑ๋ฐ›๋Š” ๊ตฌ์กฐ โ†’ ์ธ์ปจํ…์ŠคํŠธ RL. ๋ชจ๋ธ์ด ์ค‘๊ฐ„์— ์‹ค์ˆ˜ํ•ด๋„, ์ตœ์ข…์ ์œผ๋กœ ๋‹ต์„ ๋งž์ถ”๋ฉด(์ฆ‰, โ€œํ•™์Šต ๊ณผ์ •์—์„œ ์‹ค์ˆ˜๋Š” ํ—ˆ์šฉ, ๊ฒฐ๊ณผ๋ฌผ๋งŒ ์ •ํ™•ํ•˜๋‹ค๋ฉด ๋ณด์ƒโ€) ๊ทธ๊ฒƒ์œผ๋กœ ์ถฉ๋ถ„ํ•˜๋‹ค๋Š” โ€œ๋งฅ๋ฝ ๋ฐด๋””ํŠธ(Contextual Bandit)โ€ ๊ด€์ . ๊ฐ€์น˜ํ•จ์ˆ˜(๋ฐธ๋ฅ˜ ํ•จ์ˆ˜)๋‚˜ ๋ณต์žกํ•œ ๊ตฌ์กฐ ์—†์ด, โ€œ๋‹ต์ด ๋งž์œผ๋ฉด +, ํ‹€๋ฆฌ๋ฉด โ€“โ€ ์‹์˜ REINFORCE๋ฅ˜ ์ ‘๊ทผ์ด ์ž์—ฐ์Šค๋Ÿฝ๊ณ , ๊ตฌ์กฐ์ ์ธ ๊ฐ•์ œ(์˜ˆ: MCTS)๋Š” ์ง€์–‘. 4. Long CoT๊ฐ€ ์Šค์Šค๋กœ ํ™•์žฅ๋˜๋Š” ์ด์œ  RL ๊ณผ์ •์„ ์ง„ํ–‰ํ•˜๋ฉด, ๋ชจ๋ธ์€ ์ •ํ™•๋„๋ฅผ ์˜ฌ๋ฆฌ๊ธฐ ์œ„ํ•ด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์ ์  ๋” ๊ธด ์‚ฌ๊ณ  ๊ณผ์ •์„ ํ™œ์šฉ โ†’ ํ† ํฐ ๊ธธ์ด๊ฐ€ ํ•™์Šต ๊ณผ์ • ์ค‘์— ์ž๋ฐœ์ ์œผ๋กœ ์ฆ๊ฐ€ํ•จ. โ€œ๋ชจ๋ธ์ด ์„ฑ๋Šฅ์„ ์˜ฌ๋ฆฌ๋Š” ๋ฐ ํ•„์š”ํ•œ ๋งŒํผโ€ ์Šค์Šค๋กœ ๋” ๊ธธ๊ฒŒ ํƒ์ƒ‰ํ•˜๊ณ  ๋ฐ˜์„ฑ(reflection)ํ•˜๋ฉฐ, ์ž˜๋ชป๋œ ์‹œ๋„์—์„œ ๋ฐฐ์šฐ๋Š” ํŒจํ„ด์„ ํ•™์Šต. 5. ์ฃผ์š” ํ…Œ์ดํฌ์–ด์›จ์ด(First Principles) ๋†’์€ ์„ฑ๋Šฅ(Performance)์€ ๋ฌด์—‡๋ณด๋‹ค ์šฐ์„ ํ•œ๋‹ค. ๋น„์šฉ๊ณผ ์†๋„ ๋ฌธ์ œ๋Š” ํ›„์ˆœ์œ„๋กœ ํ•ด๊ฒฐ ๊ฐ€๋Šฅ. ๋ณด์ƒ์ด ์ •ํ™•ํ•ด์•ผ ํ•œ๋‹ค(์‹ค์ œ ์ •๋‹ต์„ ์•„๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฌ๋‹ค). ๋ชจ๋ธ์ด ์ƒ๊ฐ์˜ ๊ตฌ์กฐ๋ฅผ โ€˜๋‚ด์žฌ์  ํƒ์ƒ‰โ€™ ํ˜•ํƒœ๋กœ ์ž์œ ๋กญ๊ฒŒ ํŽผ์น  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค(Structured Planningโ€งMCTS๋Š” ์ œํ•œ์ ). ํ•™์Šต์€ โ€œ์‹ค์ˆ˜๊ฐ€ ์ผ์–ด๋‚  ์ˆ˜ ์žˆ์Œโ€์„ ์ „์ œ๋กœ โ†’ ์ตœ์ข… ์ •๋‹ต์ด ๋งž์œผ๋ฉด ๊ทธ ๊ณผ์ •์„ ๋ชจ๋‘ ์ธ์ •ํ•œ๋‹ค๋Š” ์‹์œผ๋กœ ๋‹จ์ˆœํ™”ํ•œ๋‹ค. ๋ชจ๋ธ์ด ์Šค์Šค๋กœ โ€œ๊ฒ€์ƒ‰(Search)+์ž๊ธฐ๋น„ํŒ(Self-Critique)โ€์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค.

์‹ค์ œ RL ํ›ˆ๋ จ์—์„œ, (๋ฌธ์ œยท๋‹ต๋ณ€) ์Œ์— ๋Œ€ํ•œ ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ์ •์˜ํ•ด(์ฝ”๋“œ: ํ…Œ์ŠคํŠธ์ผ€์ด์Šค ํ†ต๊ณผ ์—ฌ๋ถ€, ์ˆ˜ํ•™: ์ •๋‹ต๊ฒ€์ฆ ๋ชจ๋ธ ๋“ฑ) ๋ชจ๋ธ์ด ๋‹ต์„ ์ƒ์„ฑํ•˜๋ฉด ๊ทธ ์„ฑ๋Šฅ์„ ์ฆ‰์‹œ ๋ณด์ƒ์œผ๋กœ ํ™˜์‚ฐํ•ฉ๋‹ˆ๋‹ค. ์˜คํƒˆ์ž๊ฐ€ ์žˆ๋Š” ์ค‘๊ฐ„ ๋‹จ๊ณ„๋ผ๋„, ์ตœ์ข…์ ์œผ๋กœ ๋‹ต์„ ๋งž์ถ”๋ฉด ํŒจ๋„ํ‹ฐ ๋Œ€์‹  ํ•™์Šต์— ํ•„์š”ํ•œ ๋‹ค์–‘ํ•œ โ€˜์‹œ๋„ ๊ณผ์ •โ€™์„ ๊ฐ€์ ธ๊ฐ€๋Š” ์‹์œผ๋กœ ์„ค๊ณ„ํ•ด, ๋ชจ๋ธ์ด ์—ฌ๋Ÿฌ ๊ฒฝ๋กœ๋ฅผ ์‹คํ—˜ํ•˜๊ณ  ์ ์ฐจ ๊ฐœ์„ ํ•˜๋„๋ก ์žฅ๋ คํ•ฉ๋‹ˆ๋‹ค. ์ •์ฑ… ์ตœ์ ํ™”๋Š” ๊ธฐ์กด โ€œ์˜จ๋ผ์ธ ๋ฏธ๋Ÿฌ ๋””์„ผํŠธ(online mirror descent)โ€ ๋ณ€ํ˜• ๋ฐฉ์‹์„ ์“ฐ๋˜, ์˜คํ”„ํด๋ฆฌ์‹œ(off-policy) ์ƒ˜ํ”Œ๋ง, ๊ธธ์ด ํŒจ๋„ํ‹ฐ(length penalty), ์ปค๋ฆฌํ˜๋Ÿผ ์ƒ˜ํ”Œ๋ง(์‰ฌ์šด ๋ฌธ์ œโ†’์–ด๋ ค์šด ๋ฌธ์ œ ์ˆœ) ๋“ฑ์„ ๋„์ž…ํ•ด ํšจ์œจ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋กฑ-CoT ๊ฐ•ํ™”ํ•™์Šต ์‹œ, ๋งฅ๋ฝ ๊ธธ์ด๊ฐ€ ๋งค์šฐ ๊ธธ์–ด์ง€๋ฏ€๋กœ โ€œPartial Rollout(๋ถ€๋ถ„ ๋กค์•„์›ƒ)โ€์ด๋ผ๋Š” ๋ฐฉ์‹์„ ์จ์„œ ์ด์ „์— ์ƒ์„ฑํ•œ ๊ธด ํ† ํฐ ์‹œํ€€์Šค ์ค‘ ์žฌํ™œ์šฉ ๊ฐ€๋Šฅํ•œ ๊ตฌ๊ฐ„์„ ๋นผ๋‚ด ์žฌ์ƒ˜ํ”Œ๋งํ•˜๋Š” ์‹์œผ๋กœ ์‹œ์Šคํ…œ ์ž์›์„ ์ ˆ์•ฝํ•ฉ๋‹ˆ๋‹ค. 4/Long2short ๊ธฐ๋ฒ•(ํ† ํฐ ํšจ์œจํ™”) ์ตœ์ข…์ ์œผ๋กœ ์•Œ๋งž์€ ๊ธธ์ด(Short-CoT)๋กœ๋„ ๋†’์€ ์ •ํ™•๋„๋ฅผ ์œ ์ง€ํ•˜๋„๋ก, โ€œlong-CoT๋กœ ํ•™์Šต๋œ ๋ฒ ์ด์Šค ๋ชจ๋ธโ€์„ ๋‹ค์‹œ โ€˜์งง์€ ์ถ”๋ก ์šฉโ€™์œผ๋กœ ์••์ถ• ์ •๋ จํ•˜๋Š” ๋‹จ๊ณ„์ž…๋‹ˆ๋‹ค. ๊ธธ์ด ํŽ˜๋„ํ‹ฐ์™€ ๋ชจ๋ธ ๋ณ‘ํ•ฉ(merge), DPO, Rejection Sampling ๋“ฑ์„ ๋ณ‘ํ–‰ํ•˜์—ฌ, ๊ฐ€๋Šฅํ•œ ํ•œ ๊ฐ„๊ฒฐํ•œ ํ† ํฐ ์‚ฌ์šฉ์œผ๋กœ๋„ ๋†’์€ ์ •๋‹ต๋ฅ ์„ ๋‚ด๋ ค ํ•ฉ๋‹ˆ๋‹ค.

https://arxiv.org/abs/2501.12599 โ€œPretraining ๋ฐ์ดํ„ฐ ํ•œ๊ณ„ โ†’ RL ๊ธฐ๋ฐ˜ โ€˜์ƒˆ๋กœ์šด ์ถ•โ€™์„ ์—ด์–ด๋ณผ ์ˆ˜ ์žˆ์„๊นŒ?โ€ โ€ข ๊ธฐ์กด LLM ํ™•์žฅ์„ฑ: ๋ณดํ†ต โ€œ๋‹ค์Œ ํ† ํฐ ์˜ˆ์ธกโ€(next token prediction)์œผ๋กœ ๊ฑฐ๋Œ€ ๋ฐ์ดํ„ฐ์…‹์— ๋งž์ถฐ ์‚ฌ์ „ํ•™์Šต์„ ์ง„ํ–‰. ํ•œ๊ณ„: ํ•™์Šต ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฒฐ๊ตญ ์ œํ•œ๋  ์ˆ˜๋ฐ–์— ์—†์Œ. โ€ข ๋Œ€์•ˆ(First Principle): โ€œ๋ชจ๋ธ์ด ๋ณด์ƒ(reward)์„ ํ†ตํ•ด ์Šค์Šค๋กœ ํƒ์ƒ‰(explore)ํ•˜๋Š” ์ถ•โ€โ€”์ฆ‰, RL์„ ๋Œ€๊ทœ๋ชจ LLM์— ๋„์ž…ํ•˜๋ฉด, ๋” ์ด์ƒ ์ •์  ๋ฐ์ดํ„ฐ์—๋งŒ ์˜์กดํ•˜์ง€ ์•Š์•„๋„ ๋จ. ๋ฌธ์ œ: ์ง€๊ธˆ๊นŒ์ง€ RL+LLM ์„ฑ๊ณผ๊ฐ€ ๊ฒฝ์Ÿ๋ ฅ์ด ๋†’์ง€ ์•Š์•˜์Œ. โ€œKimi k1.5โ€๊ฐ€ ์ด ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ๋ชฉํ‘œ: โ€œ๋„“๊ณ  ๊ธด ์ปจํ…์ŠคํŠธ์—์„œ, RL๋กœ ์ฆ‰๊ฐ์  ํƒ์ƒ‰๊ณผ ์ž๊ธฐ-์ˆ˜์ • ๋Šฅ๋ ฅ์„ ํ•™์Šตํ•˜๋„๋ก ํ•˜์—ฌ, ๊ฒฐ๊ณผ์ ์œผ๋กœ OpenAI o1 ๋“ฑ ์ตœ์‹  ๊ฑฐ๋Œ€๋ชจ๋ธ๊ณผ ๊ฒฌ์ค„ ๋งŒํ•œ ๊ฐ•๋ ฅํ•œ Reasoning ๋ชจ๋ธ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š”๊ฐ€?โ€ โ€œLong Context + Policy Optimization ๊ฐ„๋‹จํ™”๊ฐ€ ๊ด€๊ฑดโ€ Long context scaling ์•„์ด๋””์–ด: โ€œ๋ฌธ์ œ๋ฅผ ํ’€ ๋•Œ, ์ถฉ๋ถ„ํžˆ ๊ธด ๋งฅ๋ฝ(128K ํ† ํฐ ๋“ฑ)์„ ์ฃผ๋ฉด, ๊ฑฐ์˜ โ€˜ํ”Œ๋ž˜๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜โ€™์ฒ˜๋Ÿผ ๋ชจ๋ธ์ด ์ž๋ฐœ์ ์œผ๋กœ ๊ผฌ๋ฆฌ์— ๊ผฌ๋ฆฌ๋ฅผ ๋ฌด๋Š” ์ถ”๋ก ์„ ํ•  ์ˆ˜ ์žˆ์ง€ ์•Š์„๊นŒ?โ€ ๋ฌธ์ œ: ๊ธธ์ด๊ฐ€ ๋„ˆ๋ฌด ๊ธธ๋ฉด RL ๊ณผ์ •์ด ๋น„ํšจ์œจ์ ์ด๊ฑฐ๋‚˜ โ€œ์˜ค๋ฒ„-์”ฝํ‚น(์‘๋‹ต์ด ๋„ˆ๋ฌด ๊ธธ์–ด์ง€๋Š” ํ˜„์ƒ)โ€์ด ๊ฑฑ์ •๋จ. โ†’ ์ด๋ฅผ ์œ„ํ•œ โ€œpartial rolloutโ€ ๋“ฑ ์ „๋ฌธ ์ตœ์ ํ™”๊ฐ€ ํ•„์š”. Simplistic RL framework (๊ฐ„๋‹จํ•œ ์ •์ฑ… ์ตœ์ ํ™” ๊ธฐ๋ฒ•) ๊ธฐ์กด์˜ MCTS(่’™ํ…Œ์นด๋ฅด๋กœ ํŠธ๋ฆฌ์„œ์น˜), Value ํ•จ์ˆ˜, Process Reward๋ฅผ ์•ˆ ์“ฐ๊ณ ๋„ ์ถฉ๋ถ„ํžˆ ํ™•์žฅ ๊ฐ€๋Šฅํ•จ์„ ์‹œ๋„. โ€œ์˜คํ”„-ํด๋ฆฌ์‹œ ์ƒ˜ํ”Œ๋ง + relative entropy ์ •๊ทœํ™”โ€ โ†’ ๊ฑฐ๋Œ€ํ•œ LLM์—๋„ ์ ํ•ฉํ•œ โ€œmirror descentโ€ ๋ฐฉ์‹์„ ์‰ฝ๊ฒŒ ๊ตฌํ˜„. ๊ฐ„๋‹จํ™” ์žฅ์ : ๋ณต์žกํ•œ ๋ณด์กฐ ๋ชจ๋“ˆ ์—†์ด๋„ ์ถฉ๋ถ„ํžˆ โ€œ๋‹ค์–‘ํ•œ ํƒ์ƒ‰โ€๊ณผ โ€œ์ •๋‹ต๋ฅ โ€์„ ๋™์‹œ์— ๋†’์ž„. ์ž๋ฃŒ ๊ตฌ์„ฑ, ๋ชจ๋ธ ๊ตฌ์กฐ, ํ•™์Šต ๋ ˆ์‹œํ”ผ: ์—ฌํƒ€ ์˜คํ”ˆ์†Œ์Šค์™€ ๋‹ค๋ฅธ ์  ์‚ฌ์ „ํ•™์Šต(Pretraining)์€ ๊ธฐ์กด์ฒ˜๋Ÿผ ๊ฑฐ๋Œ€ ํ…์ŠคํŠธยท์ฝ”๋“œยท์ˆ˜ํ•™ยท๋น„์ „(์ด๋ฏธ์ง€) ๋ฐ์ดํ„ฐ๋ฅผ ํ˜ผํ•ฉ ๋Œ€๊ทœ๋ชจ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ(์‚ฌ์ง„+๊ธ€) ์ž…๋ ฅ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ โ†’ ์ด๋•Œ๋„ โ€œ๊ธธ์ด ํ™•์žฅโ€๊ณผ โ€œํ’ˆ์งˆ ๋†’์€ ํ•„ํ„ฐ๋งโ€์ด ์ค‘์š” โ€œVanilla SFT(์ง€๋„ํ•™์Šต)โ€ ํ›„, โ€œLong-CoT Supervised Fine-Tuningโ€์„ ์ถ”๊ฐ€๋กœ ๋„์ž… ์ฒซ ๋‹จ๊ณ„์—์„  ์ผ๋ฐ˜ ๋ชฉ์  SFT๋กœ ๊ธฐ์ดˆ ์‚ฌ์šฉ์ž ์‘๋‹ต ํ˜•ํƒœ ํ™•๋ณด โ†’ ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ ๊ธธ๊ณ  ์ •๊ตํ•œ ์ฒด์ธ์˜ค๋ธŒ์˜ํŠธ(CoT)๋ฅผ ๋ฐ์ดํ„ฐ๋กœ ๋งŒ๋“  ํ›„ ๋‹ค์‹œ ํŒŒ์ธํŠœ๋‹. RL ๋‹จ๊ณ„ โ†“ ์ƒˆ๋กœ ๋งŒ๋“  RL PromptSet(์—„์„ ๋œ ์งˆ์˜๋“ค) Long-CoT Warmup(์†Œ๋Ÿ‰์ด์ง€๋งŒ ์‚ฌ๋žŒ ์ˆ˜์ค€์œผ๋กœ ๊น”๋”ํ•˜๊ณ  ๊ธด ์ถ”๋ก ๊ฒฝ๋กœ ์˜ˆ์‹œ๋ฅผ ์ฃผ์ž…) ์‹ค์ œ RL Policy Optimization: off-policy ์ถ”๊ฐ€ ์ƒ˜ํ”Œ(+๋งˆ์ด๋„ˆ์Šค ๋ณด์ƒ๋ถ€)์„ ๋ชจ๋‘ ์ด์šฉ, โ€œrejection sampling / partial rollout / length penaltyโ€ ๋“ฑ ์ตœ์ ํ™” ๊ธฐ๋ฒ• ๊ฒฐํ•ฉ. โ€œ๋ถ€๋ถ„ ๋กค์•„์›ƒ(Partial Rollout)โ€: ๋„ˆ๋ฌด ๊ธด ๋‹ต๋ณ€์„ ํ•œ ๋ฒˆ์— ์ „๋ถ€ ์ƒ์„ฑํ•˜์ง€ ์•Š๊ณ  ์ž˜๊ฒŒ ๋‚˜๋ˆ , ์ค‘๊ฐ„๋‹จ๊ณ„(์ด์ „ ํ•™์Šต๊ฒฐ๊ณผ) ์žฌํ™œ์šฉ. ํ•™์Šต ์Šค์ผ€์ค„ ํšจ์œจ์„ ๋†’์—ฌ โ€œ๊ธด ํ•ด์„ค ์ƒ์„ฑโ€๋„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ฆ. โ€œ๋‹จ์ˆœํ•œ RL๊ณผ ๋กฑ-์ปจํ…์ŠคํŠธ๋งŒ์œผ๋กœ๋„ ์ตœ์ฒจ๋‹จ ์ˆ˜์ค€ ๋‹ฌ์„ฑโ€ Kimi k1.5 Long-CoT ์ˆ˜ํ•™(MATH 500) 96.2 / AIME 77.5 ๋“ฑ, OpenAI o1๊ณผ ๋Œ€๋“ฑ. LiveCodeBench, Codeforces ๋“ฑ ์ฝ”๋”ฉ ๊ฒฝ์Ÿ ์ง€ํ‘œ๋„ ์šฐ์ˆ˜. ๋น„์ „(MathVista, MMMU) ํฌํ•จํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ reasoning ์„ฑ๋Šฅ STOA ๊ธฐ๋ก. Kimi k1.5 Short-CoT Long-CoT ๋ชจ๋ธ์ด ๋„ˆ๋ฌด ํ† ํฐ ๋งŽ์ด ์“ฐ๋Š” ๋ฌธ์ œ(โ€œ์˜ค๋ฒ„์”ฝํ‚นโ€) โ†’ โ€œLong2Shortโ€ ๊ธฐ๋ฒ•(๋ชจ๋ธ ์••์ถ•, DPO, ์งง์€ ์‘๋‹ต ์„ ๋ณ„ ๋“ฑ)์œผ๋กœ ์งง์€ CoT๋งŒ์œผ๋กœ๋„ ๊ธฐ์กด GPT-4o/Claude3.5๋ณด๋‹ค ํ›จ์”ฌ ์ข‹์€ ๊ฒฐ๊ณผ. AIME 2024์˜ Pass@1์ด 60.8 ๋“ฑ ๊ด„๋ชฉํ•  ๋งŒํ•œ ํ–ฅ์ƒ. โ€œRL+LongCont = ๋˜ ๋‹ค๋ฅธ ์Šฌ๋กœํ”„ ์—ด๋ ธ๋‹ค, ๊ณ„์† ํ™•์žฅ ๊ฐ€๋Šฅโ€ โ€œ์ •์  ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์ด ์•„๋‹ˆ๋ผ, ๋ชจ๋ธ์ด ์ž์ฒด์ ์œผ๋กœ ๋ณด์ƒ์„ ํ†ตํ•ด explorationํ•˜๋Š” ์ถ•์ด ์ƒˆ๋กญ๊ฒŒ ์—ด๋ฆผ โ†’ ๋ฐ์ดํ„ฐ ํ•œ๊ณ„๋ฅผ ๋„˜์„ ์ˆ˜ ์žˆ๋‹ค.โ€ โ€ข ๋‚œ์  ํ•ด๊ฒฐ: ๋„ˆ๋ฌด ๊ธธ๊ณ  ๋ณต์žกํ•œ rollouts ์ฒ˜๋ฆฌ ์œ„ํ•ด โ€œpartial rollout / length penalty / simplistic mirror descentโ€ ๋“ฑ ํ†ตํ•ฉ. โ€ข ์‹คํ—˜ ์ฆ๋ช…: ์—ฌํƒ€ ๋ณต์žกํ•œ(๊ฐ€๋ น Monte Carlo tree search, Value function) ์—†์ด๋„ simple RL ์ฒด๊ณ„์™€ ๊ธธ์–ด์ง„ ์ปจํ…์ŠคํŠธ๋งŒ์œผ๋กœ o1๊ธ‰ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ ๊ฐ€๋Šฅ. โ€ข ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„์•ผ์—์„œ๋„ ์ ์šฉ ๊ฐ€๋Šฅ: ์‹œ๊ฐ+ํ…์ŠคํŠธ ์œตํ•ฉ๋œ ๋Œ€๊ทœ๋ชจ RL์ด, ๊ธฐ์กด LLM ํ•œ๊ณ„๋ฅผ ๋„˜์–ด ์ƒˆ๋กœ์šด Reasoning ํŒจ๋Ÿฌ๋‹ค์ž„ ์‹œ๋„. ๋ฐ์ดํ„ฐ: ์–ธ์–ด(ํ…์ŠคํŠธ) ๋ฐ์ดํ„ฐ ์˜์–ดโ€ง์ค‘๊ตญ์–ด ํ…์ŠคํŠธ, ์ฝ”๋“œ, ์ˆ˜ํ•™/์ถ”๋ก , ์ง€์‹(ํ•™์ˆ  ์ž๋ฃŒ ๋“ฑ)์„ ํฌํ•จํ•œ 5๊ฐ€์ง€ ์˜์—ญ์„ ์ค‘์ ์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ค‘๋ณต ๋ฌธ์„œ๋ฅผ ์ œ๊ฑฐํ•˜๊ณ (with ์ž„๋ฒ ๋”ฉ ์œ ์‚ฌ๋„ ๋ถ„์„), ๊ธ€์ž ๊นจ์ง, ํ˜•์‹ ์˜ค๋ฅ˜, ์ŠคํŒธ์„ฑ ํ…์ŠคํŠธ ๋“ฑ์„ ๊ฑธ๋Ÿฌ๋‚ด๋Š” ๊ทœ์น™ ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง ๊ณผ์ •์„ ๊ฑฐ์นฉ๋‹ˆ๋‹ค. FastText, LLM ๊ธฐ๋ฐ˜ ์Šค์ฝ”์–ด๋ง ๋“ฑ์„ ์ˆ˜ํ–‰ํ•ด, ๊ฐ ๋ฌธ์„œ์˜ ์–ธ์–ด์  ํ’ˆ์งˆ๊ณผ ์ฃผ์ œ ์ ํ•ฉ๋„๋ฅผ ํ‰๊ฐ€ํ•œ ๋’ค, ์ค‘์š”ํ•œ ๋ฌธ์„œ๋ฅผ ์—…์ƒ˜ํ”Œ๋ง(up-sampling), ๋‚ฎ์€ ํ’ˆ์งˆ ๋ฌธ์„œ๋ฅผ ๋‹ค์šด์ƒ˜ํ”Œ๋ง(down-sampling) ํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ ๋ฐ์ดํ„ฐ ๋‹ค์–‘ํ•œ ๊ณต๊ฐœ ์ €์žฅ์†Œ(์˜ˆ: Git ๋ฆฌํฌ์ง€ํ† ๋ฆฌ)์—์„œ ์ถ”์ถœํ•œ ์†Œ์Šค์ฝ”๋“œ๋ฅผ ์ •์ œํ•ด ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. JSON, YAML ๋“ฑ ๋งˆํฌ์—… ์–ธ์–ด๋Š” ๋น„์ค‘์„ ์ค„์ด๊ณ , PythonยทC++ยทJava ๋“ฑ ๋Œ€ํ‘œ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋ฅผ ๊ณจ๊ณ ๋ฃจ ํฌํ•จํ•˜๋„๋ก ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜ํ•™ยท์ถ”๋ก  ๋ฐ์ดํ„ฐ ์ˆ˜ํ•™ ๋…ผ๋ฌธยทํ•™์ˆ  ์ž๋ฃŒยท์ˆ˜ํ•™ ๋ฌธ์ œ(์˜ˆ: ๋Œ€ํšŒ ๋ฌธ์ œ) ๋“ฑ์„ ์ˆ˜์ง‘ํ•˜๊ณ , ์ˆ˜์‹, ํŠน์ˆ˜๊ธฐํ˜ธ ๋“ฑ์ด ์ •ํ™•ํžˆ ์ธ์‹๋˜๋„๋ก ๋งž์ถคํ˜• OCR ๋ชจ๋ธ์„ ์ถ”๊ฐ€ ์ ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‘ ๋‹จ๊ณ„ ํ•„ํ„ฐ๋ง์„ ๊ฑฐ์ณ(1) ๊ฐ„๋‹จํ•œ FastText ๋ถ„๋ฅ˜๊ธฐ๋กœ ๋Œ€๋žต ๋ถˆํ•„์š” ๋ฌธ์„œ ์ œ๊ฑฐ, (2) ์ •์ œ๋œ LLM์œผ๋กœ ์„ธ๋ถ€ ํ’ˆ์งˆ ๊ฒ€์‚ฌ), ๋‚œ์ด๋„ ๋†’๊ณ  ์˜๋ฏธ ์žˆ๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ(์ด๋ฏธ์ง€+ํ…์ŠคํŠธ) ๋ฐ์ดํ„ฐ ์บก์…˜(caption) ๋ฐ์ดํ„ฐ(์ด๋ฏธ์ง€ ๊ธฐ์ˆ ), ์ด๋ฏธ์ง€์™€ ํ…์ŠคํŠธ๊ฐ€ ์„ž์ธ(interleaving) ๋ฐ์ดํ„ฐ, OCR(๊ธ€์ž ์˜์—ญ์ด ํฌํ•จ๋œ ์ด๋ฏธ์ง€) ๋ฐ์ดํ„ฐ, ์‹œ๊ฐโ€ง์ง€์‹ ๊ด€๋ จ ์ž๋ฃŒ ๋“ฑ์„ ํญ๋„“๊ฒŒ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ๊ฒฝ์šฐ, ์ด๋ฏธ์ง€๋‚˜ ์ฐจํŠธยท์ˆ˜์‹ ์ด๋ฏธ์ง€ ๋“ฑ์„ OCR ๋ชจ๋ธ๋กœ ๋‹ค์‹œ ์ถ”์ถœํ•ด ํ…์ŠคํŠธ ํ˜•ํƒœ๋„ ํ•จ๊ป˜ ํ•™์Šตํ•˜๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฏธ์ง€์™€ ํ…์ŠคํŠธ๊ฐ€ ๊ธด ๋งฅ๋ฝ์—์„œ ์„œ๋กœ ๊ต์ฐจ ์—ฐ๊ฒฐ๋˜๋Š”(interleaved) ์˜ˆ์‹œ๋“ค์„ ์ถฉ๋ถ„ํžˆ ํฌํ•จํ•˜์—ฌ, ๊ธด ์‹œ๊ฐ์  ๋ฌธ๋งฅ์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ํ•™์Šต์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•™์Šต ๋ฐฉ์‹ Kimi k1.5๋Š” ํฌ๊ฒŒ ๋‹ค์Œ ๋‹จ๊ณ„๋ฅผ ๊ฑฐ์ณ ํ•™์Šตํ•˜๋ฉฐ, ์ตœ์ข…์ ์œผ๋กœ โ€œ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ RL(๊ฐ•ํ™”ํ•™์Šต)โ€ ๊ธฐ๋ฐ˜์˜ ๋กฑ ์ฒด์ธ์˜ค๋ธŒ์†Œ๋“œ(long-CoT) ๊ธฐ๋ฒ•์„ ๋„์ž…ํ•ด ๋ชจ๋ธ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ™•์žฅ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. 1/ ๊ธฐ๋ณธ ์‚ฌ์ „ ํ•™์Šต(Pretraining) ์•ž์„œ ๊ตฌ์ถ•๋œ ๋Œ€๊ทœ๋ชจ ํ…์ŠคํŠธยท์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ์–ธ์–ด๋ชจ๋ธ(๋””์ฝ”๋” Transformer) ๊ธฐ๋ฐ˜์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. (1) ํ…์ŠคํŠธ ์ค‘์‹ฌ ํ•™์Šต โ†’ (2) ์‹œ๊ฐยท์–ธ์–ด ์œตํ•ฉ(vision-language) โ†’ (3) ๊ธด ๋งฅ๋ฝ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ ํ™œ์„ฑํ™”(์ตœ๋Œ€ 128k ํ† ํฐ) ์ˆœ์œผ๋กœ ์ ์ง„์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ RoPE(๊ฐ๊ฐ์˜ ์œ„์น˜ ์ž„๋ฒ ๋”ฉ์„ ํฌ๊ฒŒ ํ™•์žฅํ•˜๋Š”) ๊ธฐ๋ฒ•, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ๋ณ„๋„ ๋น„์ „ ํƒ€์›Œ(freezing & unfreezing), 32kโ†’128k ํ† ํฐ์œผ๋กœ ์ ์ง„์  ๋งฅ๋ฝ ๊ธธ์ด ํ™•์žฅ ๋“ฑ์ด ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค. 2/ ์Šˆํผ๋ฐ”์ด์ฆˆ๋“œ ํŒŒ์ธํŠœ๋‹(SFT) ๋ฐ ๋กฑ-CoT ์‚ฌ์ „ ํ•™์Šต ์„ ํƒ๋œ ๊ณ ํ’ˆ์งˆ ๋ฌธ์ œโ€ง๋ฌธ๋‹ต์Œ ๋“ฑ์— ๋Œ€ํ•ด ๋ชจ๋ธ ์ถœ๋ ฅ์„ ๋ฐ›์•„, ์‚ฌ๋žŒ์ด ์ง์ ‘ ํ‰๊ฐ€ํ•˜๊ฑฐ๋‚˜(์˜คํ”ˆํ˜• QA) ๋ฃฐ๋ฒ ์ด์Šคยทํ…Œ์ŠคํŠธ์ผ€์ด์Šค๋กœ ์ž๋™ ๊ฒ€์ฆํ•˜๋Š”(์ฝ”๋“œยท์ˆ˜ํ•™ ๋ฌธ์ œ) โ€˜๊ฑฐ๋ถ€ ์ƒ˜ํ”Œ๋ง(rejection sampling)โ€™์œผ๋กœ ์ •๋‹ต๋ฅ  ๋†’์€ ์˜ˆ์‹œ๋ฅผ ํ™•๋ณดํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋ชจ๋ธ์„ ์ถ”๊ฐ€ ๋ฏธ์„ธ์กฐ์ •ํ•œ ๋’ค, ํŠนํžˆ โ€œ๊ธธ๊ณ  ์ž์„ธํ•œ ๋‹จ๊ณ„์  ์ถ”๋ก โ€(Long-CoT)์„ ๋”ฐ๋กœ ํ•™์Šต์‹œ์ผœ ์ค‘๊ฐ„ ์‚ฌ๊ณ  ๊ณผ์ •(PlanningยทReflectionยทBacktracking ๋“ฑ)์„ ์ž˜ ํ‘œํ˜„ํ•˜๋„๋ก ๋งŒ๋“ญ๋‹ˆ๋‹ค. 3/๊ฐ•ํ™”ํ•™์Šต(RL) ๋‹จ๊ณ„

https://youtu.be/kYWUEV_e2ss ๋ฌธ์ œ ์ •์˜: โ€œ์ธ๊ฐ„์ด ์ž์„ธํžˆ ๊ฐ€๋ฅด์น˜๋Š” ๊ฒƒ vs. ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ํ•™์Šตํ•˜๋„๋ก ๋™๊ธฐ๋ฅผ ๋ถ€์—ฌํ•˜๋Š” ๊ฒƒโ€ โ€ข ๊ธฐ์กด ์ ‘๊ทผ๋ฒ•: ์ธ๊ฐ„ ํƒ‘๋‹ค์šด ์‚ฌ๊ณ ๋ฐฉ์‹(์ˆ˜์ž‘์—… ๊ตฌ์กฐยท์ธ๊ฐ„ ์ง๊ด€)์— ๊ธฐ๋ฐ˜ํ•ด ๋ชจ๋ธ์— โ€œ์–ธ์–ดํ•™ยท๋…ผ๋ฆฌโ€ ๋“ฑ์„ ๋ช…์‹œ์ ์œผ๋กœ ๊ฐ€๋ฅด์น˜๋ ค ๋“ฆ. ํ•œ๊ณ„: ์‚ฌ๋žŒ์ด โ€˜์–ด๋–ป๊ฒŒ ์ƒ๊ฐํ•˜๋Š”์ง€โ€™๋ฅผ ์™„๋ฒฝํžˆ ์ดํ•ดํ•œ ๊ฒƒ๋„ ์•„๋‹ˆ๊ณ , ์ด๊ฒƒ์ด ๊ณง ๋ชจ๋ธ์˜ ์ตœ์  ํ•ด๋ฒ•๊ณผ ์ผ์น˜ํ•˜์ง€๋„ ์•Š์Œ. โ€ข ๋Œ€์•ˆ(First Principle): โ€œ๋ชจ๋ธ์ด ๋‹ค๋ฃฐ ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์™€ ๋†’์€ ๊ณ„์‚ฐ๋ ฅ(Compute)์„ ์ด์šฉํ•ด, ๊ทธ ์ž์ฒด๋ฅผ '์•ฝํ•œ ์‹œ๊ทธ๋„(Weak Incentive)'๋กœ ์‚ผ์•„ โ€˜์Šค์Šค๋กœ ์‚ฌ๊ณ ยทํ•™์Šตโ€™์„ ์ด‰์ง„.โ€ ์˜ˆ: โ€œ๋‹ค์Œ ํ† ํฐ ์˜ˆ์ธกโ€์ด๋ผ๋Š” ๋‹จ์ˆœ ๋ชฉํ‘œ๋งŒ ๋˜์ ธ์ฃผ๋˜(๊ต์ˆ˜ X), ์ˆ˜์‹ญ์–ตยท์ˆ˜์กฐ ๊ฐœ ๋ฌธ๋งฅ์„ ํ•ด๊ฒฐํ•˜๋ ค ์• ์“ฐ๊ฒŒ ํ•˜๋ฉด, ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์–ธ์–ด ์ดํ•ด/์ถ”๋ก /์ž‘๋ฌธ ๋“ฑ์ด ์ƒ๊ฒจ๋‚จ(์ธ์„ผํ‹ฐ๋ธŒ O). โ€œ๋ฌด์ œํ•œ Scalabilityโ€๊ฐ€ ์ „์ œ๊ฐ€ ๋˜๋Š” ํ˜„์žฌ ํ™˜๊ฒฝ ์ „์ œ ์กฐ๊ฑด: ํ•˜๋“œ์›จ์–ด/์ปดํ“จํŒ…์ด ์ง€์ˆ˜์ ์œผ๋กœ ๋ฐœ์ „(๋น„์šฉ ์ ˆ๊ฐ์†๋„ ๋˜ํ•œ ์—„์ฒญ๋‚จ). ๊ธฐ์กด๋ฌผ๋ฆฌ(์‚ฌ๋žŒ๊ณผ ๊ฐ™์€ ์‹œ๊ฐ„์  ์ œ์•ฝ)๋Š” โ€œ์ด๋ก ์ƒ XXโ€ ์ˆ˜์ค€์œผ๋กœ ์™„ํ™”. ํ–‰๋™ ์ง€์นจ: (1) โ€œํ›จ์”ฌ ๋งŽ์€ computeโ€๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์†Œํ™”ํ•˜๋„๋ก, ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ตœ์†Œ์˜ ์‚ฌ์ „๊ฐ€์ •(Structure)์œผ๋กœ ์œ ์ง€. (2) ์‚ฌ๋žŒ์ด โ€œ๋ฌธ์ œ ํ•ด๊ฒฐ ๋‹จ์„œโ€๋ฅผ ์ง์ ‘ ์„ค๊ณ„ํ•˜์ง€ ๋ง ๊ฒƒ(์ˆซ์ž๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ๊ทธ ์‚ฌ์ „๊ฐ€์ •์ด ๋ณ‘๋ชฉ์ด ๋จ). (3) โ€œ์ธ๊ฐ„ ์ง€์‹โ€ ๋Œ€์‹ , ๋ชจ๋ธ์ด โ€œ๋ฐ์ดํ„ฐ์™€ ๋ชฉํ‘œ(์˜ˆ:๋‹ค์Œ ํ† ํฐ ์˜ˆ์ธก, ์„ฑ๊ณต ์—ฌ๋ถ€ ๋ณด์ƒ ๋“ฑ)โ€๋ฅผ ๋ฐœํŒ์‚ผ์•„ ์ž๋ฐœ์ ์œผ๋กœ ์ผ๋ฐ˜ํ™”๋œ(General) ๋Šฅ๋ ฅ์„ ์ฐพ๋„๋ก. โ€œNext Token Predictionโ€์ด ์–ด๋–ป๊ฒŒ ์ผ๋ฐ˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋‚ณ๋Š”๊ฐ€ ํ˜•ํƒœ: ์›น ์Šค์ผ€์ผ(์ˆ˜์‹ญ์–ต~์ˆ˜์กฐ ๋ฌธ์žฅ), ๊ฐ ๋ฌธ์žฅ์—์„œ ๋งค ๋‹ค์Œ ํ† ํฐ์„ ๋งžํžˆ๋Š” ๊ฒƒ์ด ์ „๋ถ€. ๊ฒฐ๊ณผ: (1) ์–ธ์–ดํ•™์  ์ง€์‹๋ถ€ํ„ฐ, ์ˆ˜ํ•™ยท์ฝ”๋”ฉยท๋…ผ๋ฆฌ๊นŒ์ง€ โ€œํ•™์Šต์ž๊ฐ€ ์Šค์Šค๋กœ ๊ฐ€์žฅ ์œ ๋ฆฌํ•œโ€ ์ผ๋ฐ˜๊ธฐ์ˆ ์„ ํ„ฐ๋“. (2) ์ธ๊ฐ„์ด ๋ณ„๋„ ๊ต๊ณผ๊ณผ์ • ์—†์ด๋„, โ€œ์ˆ˜๋งŽ์€ ๋ฌธ๋งฅ์„ ์ฒ˜๋ฆฌํ•ด์•ผ ํ•˜๋Š” ์ธ์„ผํ‹ฐ๋ธŒโ€ ๋•Œ๋ฌธ์— ์ €์ ˆ๋กœ ๋ณต์žกํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ๋ ฅ(โ€œEmergent Abilityโ€) ํš๋“. (3) ์ž‘์€ ๋ชจ๋ธ๋กœ๋Š” ๋ถˆ๊ฐ€๋Šฅํ•˜์ง€๋งŒ, ์ผ์ • ๊ทœ๋ชจ ๋„˜์œผ๋ฉด(์ฒซ ์›๋ฆฌ ์ฐจ์›์—์„œ โ€œ์ถฉ๋ถ„ํ•œ ๊ณ„์‚ฐ ์ž์›+๋ฐ์ดํ„ฐ=๊ฐ€๋Šฅโ€) ์ƒ๋‹นํ•œ ์ง€์  ๋Šฅ๋ ฅ์ด โ€˜๋Œ์—ฐโ€™ ์ถœํ˜„. โ€œEmergent Abilityโ€์™€ ์Šค์ผ€์ผ๋ง: ์ปค์ง€๋Š” ๋ชจ๋ธ์— โ€˜์•ฝํ•œโ€™ ๋ชฉํ‘œ๋งŒ ๋˜์ ธ๋„ ๋ณ„๋‚œ ๋Šฅ๋ ฅ์ด ์ƒ๊ธฐ๋Š” ์ด์œ  โ€œ์ž‘์€ ๋ชจ๋ธ ๊ธฐ์ค€โ€์—์„œ ๋ณด๋ฉด, ์‚ฌ๋žŒ์€ ๊ทธ ๋ชจ๋ธ ํ•œ๊ณ„ ์œ ํšจ ๋ฒ”์œ„๋งŒ ๋ชฉ๊ฒฉํ•˜๊ณ ๋Š” โ€œ์•ˆ ๋œ๋‹คโ€๊ณ  ๊ฒฐ๋ก ๋ƒ„. โ€ข ํ•˜์ง€๋งŒ ์ปดํ“จํŒ… ์ž์›์ด ๋Š˜๋ฉด์„œ, ์ „ํ˜€ ๋‹ค๋ฅธ ๋ฒ”์œ„(scales)์—์„œ ์ž„๊ณ„์ ์„ ๋„˜์œผ๋ฉด, โ€˜์ž์—ฐ๋ฐœ์ƒ ์ถ”๋ก  ๋Šฅ๋ ฅโ€™ ํญ์ฆ. ๋น„์œ : ๋ฌผ๋ฆฌ ์‹คํ—˜์ด๋ผ๋ฉด โ€œ๋ช‡ ๋…„ ํ›„ ๋ฐ”๋€” ๋ฒ•์น™์€ ์—†๋‹ค.โ€ โ†’ AI๋Š” โ€œํ•˜๋“œ์›จ์–ด ์ถ•์ โ€์ด ๋ฒ•์น™ ์ž์ฒด๋ฅผ ๋ฐ”๊พธ๋Š” ๊ฒฉ. ๋”ฐ๋ผ์„œ ๋น ๋ฅธ โ€˜๊ด€์„ฑ ์—†์ดโ€™ ์‚ฌ๊ณ ์ „ํ™˜(โ€œUnlearning ๊ธฐ์กด ๊ฐ€์ •โ€)์ด ํ•„์š”. ์•ž์œผ๋กœ์˜ ๋ฐฉํ–ฅ: โ€œ๋ชจ๋“  ๋ฌธ์ œ๋ฅผ ์ธ์„ผํ‹ฐ๋ธŒ๋กœ ์ •์˜ํ•˜๋ผโ€ Next Token Prediction โ†’ ์ผ์ข…์˜ โ€œ์•ฝํ•œ ๋ณด์ƒโ€์œผ๋กœ ์–ธ์–ดยท์ถ”๋ก  ์ง€์‹ ํ•™์Šตํ–ˆ๋˜ ๊ฒƒ์ฒ˜๋Ÿผ, โ€œ์ •ํ™• ์‘๋‹ตโ€ยทโ€œ์‚ฌ์‹ค ๊ฒ€์ฆโ€ ๋“ฑ ๋‹ค๋ฅธ ๋ชฉํ‘œ๋“ค๋„ ์•ฝํ•˜์ง€๋งŒ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์„ค์ • ๊ฐ€๋Šฅ. โ€ข ๊ฑฐ๋Œ€๋ชจ๋ธ ์‹œ๋Œ€: ๊ณผ๊ฑฐ์—” โ€œํ•™์Šต๋น„์šฉ์ด ๋„ˆ๋ฌด ์ปค์„œโ€ ๋น„ํšจ์œจ์ด ๋ฌธ์ œ์˜€์ง€๋งŒ, ์ด์ œ๋Š” ์ปดํ“จํŒ…์ด ๋ฌด์ œํ•œ์ ์œผ๋กœ ์ฆ๊ฐ€ ๊ฐ€๋Šฅ โ†’ ์ด ๋ฐฉ๋ฒ•์ด ์˜คํžˆ๋ ค ํšจ์œจ์ . โ€ข ๊ฒฐ๋ก : โ€œ์•ˆ ๋  ๊ฒƒ ๊ฐ™์•„ ๋ณด์ด๋Š” ๋‹จ์ˆœ ๋ณด์ƒ ๊ตฌ์กฐโ€ + โ€œ๋” ํฐ ๋ชจ๋ธ/๋ฐ์ดํ„ฐโ€ = ๋ชจ๋ธ์ด ๋ณธ์งˆ์ ์œผ๋กœ ํ›จ์”ฌ ๊นŠ์€ ๊ธฐ์ˆ (์˜ˆ: ์ž๊ธฐ๋ฐ˜์˜, ์ˆ˜ํ•™, ์น˜๋ฐ€์ถ”๋ก  ๋“ฑ)์„ ์ฐพ์„ ํ† ์–‘์ด ๋จ.

์ด์ „์— ์–ธ๊ธ‰ํ–ˆ๋˜ ๊ฒƒ์ฒ˜๋Ÿผ ์ง€๊ธˆ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๋ฌธ์ œ๋Š” o1์— ์‚ฌ์šฉ๋œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋‚ด๋Š” ๊ฒƒ์ด์—ˆ๋‹ค. ๋ฌผ๋ก  o1์˜ ๋ฐฉ๋ฒ•์ด ๋ฌด์—‡์ธ์ง€๋Š” ๊ธฐ๋ฐ€์ด๋‹ˆ ์—ฌ์ „ํžˆ ์ •ํ™•ํžˆ ์•Œ ์ˆ˜๋Š” ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ o1๊ณผ ๋™๋“ฑํ•œ ์ˆ˜์ค€์˜ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์€ ์ด์ œ ์•Œ๋ ค์กŒ๋‹ค. ๊ทธ๊ฒƒ๋„ ํ•˜๋ฃจ๋งŒ์— ๋‘ ๊ฐ€์ง€ ์‚ฌ๋ก€๋กœ. https://github.com/deepseek-ai/DeepSeek-R1 https://github.com/MoonshotAI/Kimi-k1.5 ํฅ๋ฏธ๋กœ์šด ๊ฒƒ์€ ์ด ๋‘ ๊ฐ€์ง€ ์‚ฌ๋ก€ ๋ชจ๋‘ ๊ณตํ†ต๋œ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ์ € ๋ชจ๋ธ์˜ ์ตœ์ข… ์ถœ๋ ฅ ๊ฒฐ๊ณผ์˜ ์ •๋‹ต ์—ฌ๋ถ€๋งŒ์œผ๋กœ (์ˆ˜ํ•™์ด๋ผ๋ฉด ์ •๋‹ต๊ณผ์˜ ์ผ์น˜ ์—ฌ๋ถ€, ์ฝ”๋”ฉ์ด๋ผ๋ฉด ์ปดํŒŒ์ผ๋Ÿฌ๋ฅผ ํ†ตํ•œ ์œ ๋‹› ํ…Œ์ŠคํŠธ ํ”ผ๋“œ๋ฐฑ ๋“ฑ) RL์„ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์ง€๊ธˆ๊นŒ์ง€ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์œ„ํ•œ ๋งŽ์€ ์‹œ๋„๋“ค์ด ๋‚˜์™”๊ณ  ์ด ์‹œ๋„๋“ค์€ ๋Œ€์ฒด๋กœ Process Reward Model (PRM)์„ ์‚ฌ์šฉํ•ด์„œ CoT์˜ ๊ฐ ์Šคํ…์— ๋Œ€ํ•ด Reward๋ฅผ ์ฃผ๊ฑฐ๋‚˜ MCTS๋ฅผ ํ•˜๋Š” ๊ฒƒ์ด ์ฃผ๋ฅ˜์˜€๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ๊ทธ๋Ÿฐ ์ ˆ์ถฉ์ ์ธ ๋ฐฉ๋ฒ•์ด๋‚˜ ๋ช…์‹œ์ ์ธ ํƒ์ƒ‰์„ ์ „ํ˜€ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ  ๊ฒฐ๊ณผ ๋ณด์ƒ(Outcome Reward)๋งŒ์œผ๋กœ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ชจ๋ธ์— ์ฃผ์ž…ํ•˜๋Š”๋ฐ ์„ฑ๊ณตํ•œ ๊ฒƒ์ด๋‹ค. ์‚ฌ์‹ค o1์ด MCTS ๊ฐ™์€ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ๋Š”๊ฐ€๋Š” ๊ณ„์†ํ•ด์„œ ๋…ผ์Ÿ์ ์ธ ๋ฌธ์ œ์˜€๋‹ค. TรœLU 3์—์„œ ์ •๋‹ต์„ ๊ธฐ๋ฐ˜ํ•œ RL์„ (RLVR) ํ†ตํ•ด ์ฐฝ๋ฐœ์ ์ธ ๋Šฅ๋ ฅ์ด ๋‚˜ํƒ€๋‚œ ์‚ฌ๋ก€๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํƒ์ƒ‰์ด ์•„๋‹ˆ๋ผ Outcome Reward๋ฅผ ํ†ตํ•ด ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ๋“ฑ์žฅํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ฃผ์žฅ๋„ ์žˆ์—ˆ๊ณ  (https://www.interconnects.ai/.../openais-o1-using-search...) ํƒ์ƒ‰์€ ๋‹ต์ด ์•„๋‹ˆ๋ผ๋Š” ๋ง๋„ ์žˆ์—ˆ์ง€๋งŒ (https://x.com/denny_zhou/status/1870551510741811644) ์–ด์จŒ๋“  ์ง€๊ธˆ๊นŒ์ง€ ๊ฐ€์žฅ ์ธ๊ธฐ ์žˆ์—ˆ๋˜ ๋ฐฉ๋ฒ•์€ ํƒ์ƒ‰์ด์—ˆ๋‹ค. (https://arxiv.org/abs/2501.04682) ๊ทธ๋ ‡๋‹ค๋ฉด ์™œ Outcome Reward ๊ธฐ๋ฐ˜์˜ ๋ฐฉ๋ฒ•์ด ์ฃผ๋ชฉ์„ ๋ฐ›์ง€ ๋ชปํ–ˆ์„๊นŒ? ์ด๋Š” ์ด ๋ฐฉ๋ฒ•์ด ์„ฑ๊ณต์ ์ด๊ธฐ ์œ„ํ•ด์„  ๋ฒ ์ด์Šค ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์ด ์ถฉ๋ถ„ํžˆ ๋†’์•„์•ผ ํ•˜๊ณ  ์ถฉ๋ถ„ํ•œ ๋‚œ์ด๋„์™€ ์–‘์˜ ๋ฌธ์ œ-์ •๋‹ต ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•˜๊ธฐ ๋•Œ๋ฌธ์ผ ๊ฒƒ์ด๋‹ค. ๋”ฅ ๋Ÿฌ๋‹์—์„œ ํ”ํ•˜๊ฒŒ ์ผ์–ด๋‚˜๋Š” ๋ฌธ์ œ, ์ฆ‰ ์ •๊ตํ•œ ๋ฐฉ๋ฒ•์ด ๊ทœ๋ชจ๋ฅผ ํ‚ค์šด ๋‹จ์ˆœํ•œ ๋ฐฉ๋ฒ•์— ๋ฐ€๋ฆฌ๋Š” ํ˜„์ƒ์˜ ๋ฐ˜๋ณต์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๊ฒ ๋‹ค. PRM์˜ ๋ฌธ์ œ๋Š” ๋ฌด์—‡์ผ๊นŒ? ์ผ๋‹จ PRM์„ ์ ์šฉํ•˜์ž๋ฉด CoT์—์„œ Process๊ฐ€ ๋  ๋‹จ์œ„๋ฅผ ์„ค์ •ํ•ด์•ผ ํ•œ๋‹ค. ์ด ์Šคํ…๋“ค์— ๋Œ€ํ•œ ํ•™์Šต ๋ ˆ์ด๋ธ” ๋˜ํ•œ ํ•„์š”ํ•˜๋‹ค. ์ด ๋ ˆ์ด๋ธ” ๊ตฌ์ถ•์€ ์•„์ฃผ ์–ด๋ ค์šด ์ž‘์—…์ด๊ธฐ์— ์ •๋‹ต ์—ฌ๋ถ€๋ฅผ ํ†ตํ•ด ๋ ˆ์ด๋ธ”์„ ๋ถ€์—ฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์ธ๊ธฐ๋ฅผ ์–ป์—ˆ์ง€๋งŒ ์ด๋ ‡๊ฒŒ ํ•™์Šตํ•œ ๋ชจ๋ธ์€ ํ•™์Šต ๋„๋ฉ”์ธ ๋ฐ–์œผ๋กœ ๋„˜์–ด๊ฐ€๋ฉด ์„ฑ๋Šฅ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. (https://arxiv.org/abs/2501.07301) ๋˜ํ•œ ์• ์ดˆ์— ๋ชจ๋ธ ๊ธฐ๋ฐ˜์ด๊ธฐ์— ๋ชจ๋ธ์˜ ๋ถ€์ •ํ™•์„ฑ ๋˜ํ•œ ๋ฌธ์ œ๊ฐ€ ๋œ๋‹ค. MCTS๋Š” ์–ด๋–จ๊นŒ? MCTS๋ฅผ ์œ„ํ•ด์„  ์ •ํ™•ํ•œ Value ๋ชจ๋ธ์ด ํ•„์š”ํ•˜๊ณ  ์ด๋ฅผ ํ™•๋ณดํ•˜๋Š” ๊ฒƒ์ด ๋ฌธ์ œ๊ฐ€ ๋œ๋‹ค. PRM๊ณผ MCTS ๋ชจ๋‘ CoT์— ์ผ์ •ํ•œ ๊ตฌ์กฐ๋ฅผ ๋ถ€์—ฌํ•˜๊ฒŒ ๋œ๋‹ค. PRM์—์„œ๋Š” Reward์˜ ๋‹จ์œ„๊ฐ€ ๋˜๋Š” ์Šคํ…๋“ค์ด ์ •ํ•ด์ ธ์•ผ ํ•˜๊ณ  MCTS๋Š” ํƒ์ƒ‰ ๊ณต๊ฐ„์ด ์„ค์ •๋˜์–ด์•ผ ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋”ฅ ๋Ÿฌ๋‹์˜ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ตํ›ˆ์€ ๋ฌธ์ œ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์— ๊ตฌ์กฐ๋ฅผ ๋ถ€์—ฌํ•ด์„œ๋Š” ์•ˆ ๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๋ฌผ๋ก  ์•ž์œผ๋กœ๋„ PRM์ด๋‚˜ MCTS๊ฐ€ ๋„์›€์ด ๋˜์ง€ ์•Š์„ ๊ฒƒ์ด๋ผ๊ณ  ๋งํ•  ์ˆ˜๋Š” ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‹จ์ˆœํ•œ ๋ฐฉ๋ฒ•์„ Scaling ํ•˜๋Š” ๊ฒƒ์ด ํ•ด์•ผ ํ•  ์ฒซ ๋‹จ๊ณ„์ธ ๊ฒƒ๋„ ์‚ฌ์‹ค์ด๋‹ค. ์ด๋Ÿฐ ์ถ”๋ก  ๋ชจ๋ธ๋“ค์„ ํ†ตํ•ด ๋ฒ ์ด์Šค ๋ชจ๋ธ์„ ๋” ๊ฐ•ํ™”ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€, ๊ทธ๋ฆฌ๊ณ  ์ง€๊ธˆ ์ •๋‹ต์„ ์•Œ ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ œ๋“ค์— ๋Œ€ํ•ด ํ•™์Šตํ•œ ๋ชจ๋ธ์ด ์šฐ๋ฆฌ๊ฐ€ ๋ชฉํ‘œํ•˜๋Š” ์ •๋‹ต์„ ์•„์ง ๋ชจ๋ฅด๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฒƒ์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€ ๋“ฑ ์ƒ๊ฐํ•˜๊ณ  ์—ฐ๊ตฌํ•  ๋ฌธ์ œ๋“ค์€ ๋งŽ์ด ์žˆ๋‹ค. ์‹ค์šฉ์ ์œผ๋กœ๋Š” ๋” ๋‹ค์–‘ํ•œ ๊ณผ์ œ๋“ค์— ๋Œ€ํ•ด ์ •๋‹ต ์—ฌ๋ถ€๋ฅผ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์„ ๊ฐœ๋ฐœํ•˜๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•˜๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ผ๋‹จ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ–ˆ๋‹ค๋ฉด ๊ทธ ์ง€์ ์—์„œ ๋‚˜์•„๊ฐ€๋Š” ๊ฒƒ์€ ํ•œ๊ฒฐ ์‰ฝ๋‹ค. # DeepSeek-R1 ๋ฆฌํฌํŠธ์—์„œ ๋งํ•˜๋“ฏ Distillation์€ ๋ชจ๋ธ์— ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ถ€์—ฌํ•˜๋Š” ์•„์ฃผ ์†์‰ฌ์šด ๋ฐฉ๋ฒ•์ด๋‹ค. ์‚ฌ์‹ค o1์„ ์žฌํ˜„ํ–ˆ๋‹ค๊ณ  ์ฃผ์žฅํ•œ ๋งŽ์€ ์‹œ๋„๋“ค์ด Distillation์— ์˜์กดํ•˜๊ณ  ์žˆ๋‹ค. (๋‚˜๋Š” ์™ธ๋ถ€ ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๋ฅผ ์‚ฌ์šฉํ•ด ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์„ Distillation์ด๋ผ๊ณ  ๋ถ€๋ฅด๋Š” ๊ฒƒ์— ๋ฐ˜๋Œ€ํ•˜๊ณ  ์‹ถ์ง€๋งŒ ์ด๋ฏธ ๋„ˆ๋ฌด ๊ด‘๋ฒ”์œ„ํ•œ ์šฉ๋ฒ•์ด ๋˜์–ด๋ฒ„๋ ธ์œผ๋‹ˆ ์–ด์ฉ” ์ˆ˜ ์—†์„ ๋“ฏ ์‹ถ๋‹ค.) ์‚ฌ์‹ค ์ž‘์€ ๋ชจ๋ธ์—์„œ๋Š” RL๋ณด๋‹ค Distillation์ด ๋” ํšจ๊ณผ์ ์ด๋ผ๊ณ  ์–ธ๊ธ‰ํ•˜๊ณ  ์žˆ๊ธฐ๋„ ํ•˜๋‹ค. RL์ด ์ œ๋Œ€๋กœ ์ž‘๋™ํ•˜๋ ค๋ฉด ๊ฐ•๋ ฅํ•œ ๋ฒ ์ด์Šค ๋ชจ๋ธ์ด ๋’ท๋ฐ›์นจ๋˜์–ด์•ผ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋ฆฌํฌํŠธ์—์„œ ์–ธ๊ธ‰ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์˜ ๊ฒฝ๊ณ„๋ฅผ ํ™•์žฅํ•˜๋ ค๋ฉด ๋” ๊ฐ•๋ ฅํ•œ ๋ฒ ์ด์Šค ๋ชจ๋ธ๊ณผ ๋Œ€๊ทœ๋ชจ RL์„ ํ†ตํ•  ์ˆ˜๋ฐ–์— ์—†๋‹ค. ๋”ฐ๋ผ์„œ ์ง„์ •์œผ๋กœ ํฅ๋ฏธ๋กœ์šด ๊ฒƒ์€ ๊ทธ ๊ฒฝ๊ณ„๋ฅผ ํ™•์žฅํ•˜๋Š” ์ž‘์—…๊ณผ ๊ทธ ์˜์—ญ์— ์žˆ๋‹ค. # DeepSeek์˜ ์ฐฝ๋ฆฝ์ž๊ฐ€ ์ธํ„ฐ๋ทฐ์—์„œ AGI์— ๋„๋‹ฌํ•˜๊ธฐ ์œ„ํ•œ ๊ธฐ์ˆ ์  ํ˜์‹ ์— ๋Œ€์‹  ํ˜„์žฌ์˜ ๊ธฐ์ˆ ์„ ํ†ตํ•œ ์‘์šฉ์ด๋‚˜ ์ด์œค ์ฐฝ์ถœ์— ์ง‘์ค‘ํ•  ์ƒ๊ฐ์€ ์—†๋‹ค๋Š” ์‹์œผ๋กœ ์–ธ๊ธ‰ํ•œ ์ ์ด ์žˆ๋‹ค. (https://www.chinatalk.media/.../deepseek-ceo-interview...) ์ด ๊ธฐ์ˆ ์  ํ˜์‹ ์— ๋Œ€ํ•œ ์ง‘์ค‘์ด ์ง€๊ธˆ DeepSeek์ด ๊ณต๊ฐœํ•˜๊ณ  ์žˆ๋Š” ์„ฑ๊ณผ์˜ ๋™๋ ฅ์ด์—ˆ์œผ๋ฆฌ๋ผ๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด๊ฒƒ์ด ์˜คํžˆ๋ ค ํ•ฉ๋ฆฌ์ ์ธ ์„ ํƒ์ผ ์ˆ˜ ์žˆ๋‹ค. ํ˜„์žฌ ์ˆ˜์ค€์˜ LLM์˜ ๋Šฅ๋ ฅ์€ ์ œํ•œ์ ์ด๊ณ  ๋”ฐ๋ผ์„œ ๊ทธ๊ฒƒ์„ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ„์•ผ์™€ ์ฐฝ์ถœํ•  ์ˆ˜ ์žˆ๋Š” ์ด์œค ๋˜ํ•œ ์ œํ•œ์ ์ผ ์ˆ˜๋ฐ–์— ์—†๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์ง€๊ธˆ ๊ฐ€๋Šฅํ•œ ์˜์—ญ์—์„œ ์ด์œค์„ ์งœ๋‚ด๋ ค ์‹œ๋„ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค๋Š” ๊ฐ€๋Šฅํ•œ ์˜์—ญ์„ ๋Š˜๋ฆฌ๋Š” ๊ฒƒ์— ์ง‘์ค‘ํ•˜๋Š” ๊ฒƒ์ด ๋‚˜์„ ์ˆ˜ ์žˆ๋‹ค. ์ด ์˜์—ญ์˜ ๋ฐœ์ „ ์†๋„๋ฅผ ๊ณ ๋ คํ–ˆ์„ ๋•Œ ์ด ๊ธฐ์ˆ ์ด ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ฒ”์œ„์— ๋Œ€ํ•ด ๊ฐ€๋Š ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜๊ธฐ๊นŒ์ง€ ๊ฑธ๋ฆด ์‹œ๊ฐ„์€ ๊ทธ๋ฆฌ ๋งŽ์ง€ ์•Š๋‹ค. ์ฆ‰ ๊ต‰์žฅํžˆ ์žฅ๊ธฐ์ ์ธ ํˆฌ์ž๊ฐ€ ํ•„์š”ํ•˜์ง€๋Š” ์•Š์„ ๊ฒƒ์ด๋ผ๋Š” ์˜๋ฏธ์ด๋‹ค. (๋ฌผ๋ก  ๋น„์šฉ์€ ํด ์ˆ˜ ์žˆ๋‹ค.) ๊ทธ๋ ‡๋‹ค๋ฉด ๊ตณ์ด ์ง€๊ธˆ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์กฐ๊ธˆ์˜ ์ด์œค์„ ์œ„ํ•ด ์กฐ๋ฐ”์‹ฌ์„ ๋‚ผ ํ•„์š”๋Š” ์—†๋‹ค. ๊น€์„ฑํ˜„๋‹˜