产品

H100

NVIDIA H100 Tensor Core GPU

英伟达 H100 Tensor Core GPU 的互联带宽为双向 900G,这使其与 H800 形成关键差异——后者被限制在 400G,恰好慢了一倍。这一带宽差距直接影响了大模型训练中的节点内通信效率:真格基金在 2025 年 2 月的分析中指出,DeepSeek 在 H800 上所做的内存压缩、显存占用减少、通信量减少等工程优化,本质上都是在弥补 NVLink 带宽不足的问题,而 H100 的实测单向速率约为 160G,远低于 400G 的双向理论值。

在推理场景下,H100 的架构瓶颈也被重新审视。算苗科技创始人汪福全对「暗涌」表示,H100 在跑 AI 推理时高达 70% 的计算单元处于空转状态,等待数据从内存搬运——过去 20 年计算能力增长 60000 倍,而内存带宽仅增长 100 倍。这一判断构成了算苗科技以 3D 堆叠架构专攻推理芯片的逻辑起点:其目标是通过将内存芯片直接叠在计算核心上方,实现 16-32TB/s 的带宽,相当于英伟达 B200 的 4 倍。

2025 年 7 月,英伟达 CEO Jensen Huang 宣布可重新向中国销售 H100。在此之前,中国市场主要依赖 H800 等"阉割版"替代方案,后者因传输速率和内存容量受限,直接影响训练速度。

由 AI 生成,可能出现错误,请仔细核对内容。

H100产品
NVIDIA H100 Tensor Core GPU
暂无关系图谱
在 3 篇文章中被提及

相关报道