产品

H100

NVIDIA H100 Tensor Core GPU

英伟达 H100 Tensor Core GPU 的互联带宽为双向 900G，这使其与 H800 形成关键差异——后者被限制在 400G，恰好慢了一倍。这一带宽差距直接影响了大模型训练中的节点内通信效率：真格基金在 2025 年 2 月的分析中指出，DeepSeek 在 H800 上所做的内存压缩、显存占用减少、通信量减少等工程优化，本质上都是在弥补 NVLink 带宽不足的问题，而 H100 的实测单向速率约为 160G，远低于 400G 的双向理论值。

在推理场景下，H100 的架构瓶颈也被重新审视。算苗科技创始人汪福全对「暗涌」表示，H100 在跑 AI 推理时高达 70% 的计算单元处于空转状态，等待数据从内存搬运——过去 20 年计算能力增长 60000 倍，而内存带宽仅增长 100 倍。这一判断构成了算苗科技以 3D 堆叠架构专攻推理芯片的逻辑起点：其目标是通过将内存芯片直接叠在计算核心上方，实现 16-32TB/s 的带宽，相当于英伟达 B200 的 4 倍。

2025 年 7 月，英伟达 CEO Jensen Huang 宣布可重新向中国销售 H100。在此之前，中国市场主要依赖 H800 等"阉割版"替代方案，后者因传输速率和内存容量受限，直接影响训练速度。

由 AI 生成，可能出现错误，请仔细核对内容。

H100产品

NVIDIA H100 Tensor Core GPU

暂无关系图谱

在 3 篇文章中被提及

H100

相关报道

一家水下AI芯片公司完成10亿元融资，瞄准大模型推理

模型与「壳」的价值同时被低估？真格基金戴雨森 2025 AI 中场万字复盘

万字赏析 DeepSeek 创造之美：DeepSeek R1 是怎样炼成的？