ch
Feedback
咸咸湿湿

咸咸湿湿

前往频道在 Telegram

最💗新💗最💗热💗咸💗鱼💗资💗讯

显示更多
未指定国家未指定类别
203
订阅者
无数据24 小时
-17
-130
帖子存档
sys��if 🤔
sys��if 🤔

老黄设备里就 GB10 是统一内存空间的 毕竟 GB10 不配用 HBM

老黄官方口径是所有 Grace Blackwell 设备里就 GB10 不配使用 GDS/GDS RDMA。但实际上已经有网友确定了 cuFile 能用,RDMA 估计也能搞出来。 反正问就是老黄等级森严。

我想等 Qwen3.6 122B-A10B 出来的时候自己跑一个量化,想着在它发布之前先本地量化一个更小的模型试试看能不能跑通这个流程。 结果 35B-A3B 差不多正好比我内存一半大一点,唉老黄。

啧 HuggingFace 那个 transformers 库对 GB10 很不友好啊。它默认会 mmap 文件,这在 RAM VRAM 互相独立的时候无所谓,但在 GB10 上会导致它最多只能载入空闲内存一半大的模型。

作为显存被占用的空间没有被算在 buff/cache 分类下,之前根本没想到能用 vm.drop_caches=3 解决。唉老黄。

在 GB10 上干掉 vLLM 后不会自动释放被显存占用的空间。之前一直以为是主线内核里缺东西了,想着反正也没多麻烦就直接重启了。 今天重新搜了一下,在一个奇怪网站上找到了疑似官方的 workaround:只需要 echo 3 > /proc/sys/vm/drop_caches 就行了。ber,这设计合理吗?怎么会是这个 sysctl 端点? https://nvidia.custhelp.com/app/answers/detail/a_id/5728/~/unexpected-available-memory-reporting-on-dgx-spark

还有 Opus 1.7(x
还有 Opus 1.7(x

这字体,还以为二月就有 5.5 Codex 了
这字体,还以为二月就有 5.5 Codex 了

宫廷小丑这个职业太恐怖了.jpg

哇牛
哇牛

阿里赶紧把千问 3.6 122B-A10B 端上来吧,我等不及了.jpg

老黄应该算是在 Volta 那一代开始拿金色当硬件主题色的,还做挺好看

当年 Radeon VII 发布的时候根本没多少人买,毕竟本身性能说不上好。 矿潮的时候这卡被人炒上天了。要不是核心性能过于孱弱,不然因为它有 HBM2 显存,估计又会被跑人工智障的人炒( 这卡的皮真的很好看

Repost from 煎蛋无聊图
Q_Z: jandan.net/t/6133201 OO: 234 XX: 21 蛋友e63b64bec06ee: AI好啊 OO: 62, XX: 0 蛋友16fd7570b1e3c: 艹,摇铃铛的大爷,AI整一个 OO: 24, XX: 1 纸歪
+1
Q_Z: jandan.net/t/6133201 OO: 234 XX: 21 蛋友e63b64bec06ee: AI好啊 OO: 62, XX: 0 蛋友16fd7570b1e3c: 艹,摇铃铛的大爷,AI整一个 OO: 24, XX: 1 纸歪线: 那个小红书水印是人抹掉的还是数据污染上去的😨 OO: 18, XX: 1

还以为是那个 EPIC 呢
还以为是那个 EPIC 呢

都有 Mythos 这种网络安全大手子了怎么还会被偷,是不是 Mythos 不行啊

超市里看到的
超市里看到的

ber,怎么还有人给起亚 K5 装倍耐力 P Zero 的,嫌钱多?