<NullPointerException> 二周目
前往频道在 Telegram
885
订阅者
+224 小时
+37 天
+430 天
帖子存档
“好,把他们上市😡😡😡”
“What was your mission in Shanghai😠”
“金杰活了😱!!!”
“让西方朋友们做出回答😤”
“最优质的战士😠!”
Repost from 风向旗参考快讯
DeepSeek 使用了比 CUDA 更底层的 Nvidia PTX 进行编程
DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇编式语言 PTX (并行线程执行) 编程而不是标准的 CUDA 实现的。PTX 是 Nvidia 为其 GPU 设计的中间指令集架构,位于高级 GPU 编程语言 (如 CUDA C/C++ 或其他语言前端) 和低级机器代码 (流式汇编或 SASS) 之间。它将 GPU 公开为数据并行计算设备,因此允许细粒度优化,例如寄存器分配和线程/warp 级别调整,这是 CUDA C/C++ 和其他语言前端无法实现的。
在训练其 V3 模型时,DeepSeek 重新配置了 H800 GPU:在 132 个流式多处理器中,它分配了 20 个用于服务器间通信,可能用于压缩和解压数据,以克服处理器的连接限制并加快速度。为了最大限度地提高性能,DeepSeek 还实现了高级管道算法,可能是通过进行超精细的线程/warp 级别调整。这些修改远远超出了标准 CUDA 级开发,维护起来非常困难,这种级别的优化反映了 DeepSeek 工程师的卓越技能。
—— Tom's Hardware
Repost from 风向旗参考快讯
微软正在调查 DeepSeek 关联组织是否以不当方式获取 OpenAI 数据
据知情人士透露,微软和 OpenAI 正在调查 OpenAI 技术生成的数据是否被一个与中国人工智能初创公司 DeepSeek 有关的团体以未经授权的方式获取。微软的安全研究人员在去年秋季观察到他们认为可能与 DeepSeek 有关的个人使用 OpenAI 应用程序编程接口 (API) 窃取了大量数据。作为 OpenAI 技术合作伙伴和最大投资者的微软已将这一活动通知了 OpenAI。此类活动可能违反 OpenAI 的服务条款,也可能表明该组织采取行动取消了 OpenAI 对其可获取数据量的限制。特朗普总统的人工智能主管戴维·萨克斯周二表示,有“大量证据”表明 DeepSeek 依靠 OpenAI 模型的输出来开发自己的技术。
—— 彭博社
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
