웰스파고) 반도체/IT 헤드라인 정리; NVDA, 클라우드 매출 공유 모델 도입 / SK하이닉스 SCA, 상한가 없나? / 소프트뱅크, 미국 내 10GW 계획 등
1. NVIDIA, 신규 클라우드 매출 공유(Revenue-Sharing) 비즈니스 모델 발표
NVIDIA는 신규 매출 비즈니스 모델에 관한 블로그를 게시하였으며(here), 이를 통해 AI 클라우드 업체들이 매출 공유 및 신용 지원(credit support) 모델을 바탕으로 AI 네이티브, 엔터프라이즈, ISV 고객을 대상으로 NVIDIA 인프라를 조달할 수 있도록 하였습니다. NVIDIA는 Sharon AI(약 4만 개 GB300 GPU)와 Firmus(약 360mW / 약 17만 개 GPU)와의 최초 계약을 강조하였습니다. NVDA의 초점은 매출 공유 모델을 통해 컴퓨팅 용량 접근성을 더 빠르게 개방하는 데 있습니다.
AI 클라우드 업체들은 NVDA 기반 서비스를 판매하게 되며, 이를 통해 NVDA는 표준 제품 매출과 클라우드 매출의 일부를 함께 확보하게 되어, 사용량에 연동된 반복적 매출 흐름을 창출하게 됩니다.
참고로, NVIDIA의 (6/29) Firmus와의 계약 발표(약 360mW / 약 17만 개 AI 가속기)는 최초 6년 기간 동안 250억~300억 달러 규모의 오프테이크(off-take) 계약이 예상된다고 언급된 바 있습니다.
참고: Firmus는 또한 Project Southgate를 개발 중이며, 이는 호주 태즈메이니아에서 최대 400mW 용량을 공급하는 것으로 초기 계획되었습니다. Firmus는 2028년까지 Project Southgate를 최대 1.6GW 규모의 가동 AI 팩토리로 확장할 계획을 밝힌 바 있으며, 이전에는 태즈메이니아 및 멜버른 프로젝트를 통해 2026년 중반까지 150mW / 약 5만 4천 개 GB300 규모에 도달할 계획이라고 언급하였고, 이 중 약 1만 8,500개 GB300이 2026년 4월 중 가동될 것으로 언급되었습니다.
2. SK하이닉스, 메모리 SCA에서 상한가(Ceiling Price)를 배제하는 방향으로 전환?
TrendForce는(here 참조) Green Economy News의 기사를 인용하여, SK하이닉스가 업계 표준인 가격 상한선을 배제하는 SCA 계약을 채택하고 있다고 보도하였습니다 - 이는 마이크론(MU)이 발표한, 하한가부터 상한가까지 설정된(상한가는 2026년 2분기 평균 가격 기준) 14건의 SCA와는 차이가 있습니다. 하이닉스의 계약 구조는 공급 부족으로 시장 가격이 상승할 경우, 현물 시장 가격 상승분이 계약 가격에 온전히 반영될 수 있도록 하는 것으로 언급되었습니다.
저희 의견: 저희가 나눈 대화들을 근거로 볼 때, 고객사들이 어느 정도의 가격 확실성을 원한다고 보고 있는 만큼, 지난주 마이크론의 발표를 감안하면 이러한 움직임은 다소 의외라고 판단됩니다.
TrendForce의 기사는 또한 마이크론의 HBM, DDR6, LPDDR6 차세대 제품용 SCA는 협상된 조건을 통해 별도로 가격이 책정되고 있다는 점을 지적하고 있습니다.
3. 소프트뱅크, 미국 내 AI 인프라 용량 10GW 임대 계획
Bloomberg는 소프트뱅크와 그 통신 자회사가 미국 내에서 AI 인프라 용량 임대 사업을 시작할 계획이라고 보도하였으며, 해당 보도에서는 CoreWeave와 Nebius가 언급되었습니다. 보도에 따르면 동사는 2030년까지 10GW를 목표로 하고 있으며, 텍사스에서 최초로 사업을 개시할 예정입니다.
해당 계획은 SB Neo Inc.를 설립하여 하이퍼스케일러를 포함한 대기업들에게 AI 컴퓨팅 용량 및 클라우드 서비스를 제공하는 것입니다.
4. 애플 생산 관련 헤드라인 - CY26 생산량 2억 2천만 대 크게 상회, 울트라 모델 1천만 대 계획
전일 오후 CY26 스마트폰 생산 감축에 애플이 포함되었다는 보도에 이어, NikkeiAsia는 애플의 CY26 생산량이 2억 2천만 대를 '크게 상회'할 것이라고 보도하였습니다(Gartner 추정치는 CY25 약 2억 2,600만 대, CY24 약 2억 3,700만 대). 2026년 하반기에는 약 8천만 대 규모의 스마트폰용 부품이 발주된 상태입니다. 해당 보도는 또한 아이폰 울트라 생산 계획이 기존 700만~800만 대에서 약 1천만 대로 증가하였다고 언급하였습니다.
이는 현재 시장 컨센서스인 CY26 아이폰 생산량 전년 대비 약 4% 증가한 2억 5,800만 대(CY25 추정치 2억 4,800만 대 대비)와 비교되는 수치라는 점을 저희는 짚어드립니다.
5. Thinking Machines와 Bridgewater AIA Labs 연구, 도메인 특화 사후학습(Post-Trained) 모델의 성능 및 비용 이점 강조
저희는 Thinking Machines와 Bridgewater AIA Labs의 사후학습 모델(블로그 here)을 주목할 필요가 있다고 보며, 해당 연구는 범용(merchant) 모델 대비 상당한 비용 및 성능상의 이점을 보여주고 있습니다.
기본 모델로는 Qwen3-235B를 활용하여 파인튜닝을 진행하였으며, 초기 파인튜닝은 group relative policy optimization을 활용하여 테스트에서 정확도를 약 73% 및 약 89%까지 끌어올렸습니다(Qwen 기본 모델의 약 45% 및 약 55%에서 상승). 이후 추가적인 최적화(interleaved batching, 비대칭 클리핑을 적용한 CISPO loss, 강력한 교사 모델을 활용한 on-policy distillation)를 통해 정확도를 약 85% 및 93%까지 추가로 끌어올렸습니다.
또한 해당 학습 모델은 1천 개 작업당 4.72달러로 구동되며, 이는 GPT-5.2, GPT-5.4, Opus 4.6이 각각 1천 개 작업당 19.96달러, 28.50달러, 61.52달러인 것과 대비됩니다.
해당 연구는 또한 더 강력한 프롬프트를 사용할 경우에도 정확도가 테스트 항목(다양한 기사의 관련성 판단, 콘텐츠 라벨링, 문서 및 이메일 절단)에서 70%대 중반까지 상승한 반면, 프론티어 모델들은 약 50%의 정확도에 그쳤다는 점을 강조하였으며, 최신 모델들이 해당 영역에서 큰 폭의 점진적 개선을 보이지 못하고 있다는 점도 언급하였습니다.
저희의 의견: 저희는 이를 Harvey/Applied Compute의 사례 연구(here)에 이어, 도메인 특화 사후학습의 상대적 이점을 입증하는 추가적인 데이터 포인트로 보고 있습니다. 해당 사례 연구에서는 GLM-5.1 사후학습 모델이 Harvey의 법률 에이전트 벤치마크에서 Opus 4.8 Max 및 GPT-5.5 xhigh를 상회하는 성능을 보인 바 있습니다.