全球半导体行业股价暴涨后，AI算力的下一个十年属于谁？ | Linear View

线性资本·2026年6月3日·32·55

股价是情绪投票器，产业才是价值称重机。

近段时间，全球二级市场的半导体板块出现剧烈波动，个股也呈现出分化走势。但在股价涨跌的表象之下，一个更深层的产业命题正在浮出水面：AI的算力重心，是否正在从训练转向推理？

5月26日，线性资本创始人兼CEO王淮受邀参与**《巴伦菁英月谈会》**，抛开短期股价波动的表象，从技术本质和产业趋势出发，对ARM与x86的架构之争、英伟达CUDA生态的真实壁垒、训练与推理算力格局的演变，以及存储芯片与GPU的协同关系，给出了系统而深入的解读。

以下为当天直播内容的部分实录，仅为个人技术观点分享，不构成任何投资建议，欢迎大家讨论。

近期全球二级市场半导体板块异动显著。单纯从股价涨跌看，这似乎又是一次资金轮动下的短期博弈；但如果将视线从K线图移开，深入芯片设计的底层逻辑，会发现二级市场的这些异动，其实折射出一个正在加速演变的产业命题：

AI的核心算力需求，是否正在从训练端转向端侧推理？ 如果是，这将如何重塑从指令集架构、芯片设计到生态格局的整个技术版图？

ARM的暴涨究竟是短期财报催化的情绪爆发，还是RISC（精简指令集）在AI推理时代价值重估的起点？英伟达的CUDA生态是否真的牢不可破——在训练端或许如此，但在推理端，AMD、谷歌、微软的自研芯片又能撕开多大的缺口？当推理算力负载已经超过训练，未来更将占到七至八成，这对芯片的功耗、成本、内存带宽和异构设计又提出了哪些全新的技术挑战？

这些问题，可能无法通过复盘资金流向或解读技术图表来回答。它们需要回到技术的源头，从指令集、架构设计、生态护城河等底层逻辑出发，才能找到真正有意义的答案。

**巴伦孙骋：**ARM单周暴涨42.58%，市场核心交易逻辑是"AI从训练转向端侧推理，ARM架构将大幅受益"。所以从技术角度分析，ARM的指令集和授权模式在AI推理场景中相比x86有哪些本质优势？这一轮价值重估是短期财报催化，还是产业长期拐点？

线性王淮： 从技术层面看，市场现在转向以端侧推理为主的AI算力应用，这个大逻辑是比较明显的。ARM比x86更适合端侧的核心原因有三点：

第一，指令集优势。ARM是RISC（精简指令集），x86是CISC（复杂指令集）。RISC不需要将流水线设计得过于复杂，因此相同芯片面积下可以集成更多核心、缓存或专用加速单元，有利于近内存计算。在AI推理中，一个重大瓶颈就是内存通信。ARM具有灵活的物理IP和定制化能力，天然适合AI推理运算。在典型端侧负载下，ARM架构能效显著优于x86，功耗通常可低近一半，带来巨大的成本优势。

第二，授权模式优势。ARM是IP授权模式，客户可以在拿到授权后做定制化设计，比如将CPU与GPU、NPU如何配合，可以自由操作。而x86是一个"黑盒子"，很难在其基础上做异构分层的优化设计。这种开放性使得ARM在设计高带宽内存（LPDDR）整合时更受欢迎。

第三，矩阵运算优化。Transformer模型中用到最多的矩阵乘法，在ARM上的优化比x86高效得多。x86虽然也能高效做矩阵乘法，但想要达到相同吞吐的能效和面积效率，就不如ARM的向量方案，在端侧不划算。如果你关心兼容性和成熟度，可以选择x86；但如果关心性价比和功耗（未来巨大的成本选项），ARM优势明显。

从产业趋势看，AI正从训练转向推理，尤其是向Agentic AI发展。 这不仅是大模型对话，还涉及大量API调用、网络和文件调用，这些都依赖CPU。ARM作为CPU，在端侧（PC、手机、汽车等）的Agentic AI应用中充满期待。

我认为大方向是对的，产业拐点的认识已经形成。但短期股价波动会非常大，长期看这些大方向的落地会夯实价值。长期是称重机，短期是情绪投票器。

巴伦孙骋： 英伟达上周（5月18日那周）下跌2.58%，市场担忧其增长放缓。AMD上涨3.60%。在AI芯片领域，英伟达的CUDA生态护城河是否依然牢固？AMD的MI系列GPU在推理场景中能否缩小差距？客户自研芯片对英伟达的威胁有多大？

线性王淮：在训练端，目前没有人能撼动英伟达的地位。 但随着大模型普及和Agentic AI的发展，推理端算力需求大幅提升，这给了其他玩家机会。推理端的需求更加复杂，需要CPU、GPU、NPU等异构架构协同设计，对内存要求也很高。这让AMD等厂商真正获得了分一杯羹的机会。

AMD在推理端肯定会受益于"天下苦英伟达久矣"的情绪。企业需要一个可靠的第二供应商来保证供应链安全，避免被单一供应商卡脖子。因此，只要有一个可行的第二供应商出现，客户就会给予额外倾斜。AMD数据中心业务增速显著，但整体营收增长仍远低于股价涨幅，这当中当然有情绪波动的因素在，但市场对推理端巨大机会的释放是真实的。

对于英伟达，推理端的销售多少会受到影响，但并非致命。CUDA的护城河不是一天两天能被轻易超越的。 同时，谷歌、微软、亚马逊等都在自研推理芯片，一方面是减少对单一供应商的依赖，另一方面是可以针对自己擅长的场景做定制化异构设计。这个趋势很明显。但最泛用的、通用性最强的芯片仍然是英伟达。未来两三年，即使在推理端，英伟达仍然会占据主要份额，只是集中度不会像训练端那么高。训练端可能短期内没有实质性挑战者。

巴伦孙骋： 市场观点认为，AI投资正从"训练算力"转向"推理应用"。从实际部署来看，当前全球AI工作负载中训练与推理的比例大概是多少？ 未来两年推理占比会如何变化？这种切换对芯片设计、存储带宽、功耗等提出了哪些新的技术挑战？

线性王淮： 我查阅了一些报告，目前推理与训练所占用的算力负载比例大约在6:4或5.5:4.5，推理已经超过了训练。 但资本支出（Capex）是反过来的，训练仍占六成，推理占四成，因为训练所需的超级节点成本更高。

未来推理占比会大幅提升。 一方面，大模型应用在全球的普及率其实还很低。数据显示，地球上从未接触过大模型应用的人还占86%。除了中美两国，很多国家的大模型应用很少。另一方面，Agentic AI会大幅增加对大模型的调用次数。未来三到五年，推理算力占比达到七到八成是完全有可能的。

另一个原因是**训练端的迭代速度在大幅放缓。**能做大型模型训练的公司正在集中，越来越少的企业负担得起训练成本。竞争减少后，企业会更倾向于将现有模型商业化变现，而不是快速推出新模型。训练端算力需求相对降低。除非未来具身智能或世界模型等领域出现新的万卡级别训练突破，那可能成为新的变量。

这种从训练到推理的切换，对芯片设计提出了更高要求。 推理端对成本、功耗和延迟极为敏感，且需要适配从云到端的多样化场景，这就为不同架构（如GPU、ASIC、CPU）提供了细分切入机会。对内存带宽和上下文缓存（KV Cache）的要求也比训练端更加复杂。这些技术挑战恰恰给了ARM这类架构和存储芯片更多的市场机会。

**巴伦孙骋：**AI服务器需求爆发，有观点认为"AI存储芯片将接力GPU成为行情新引擎"。你认为存储芯片能否真正接棒？其成长空间与GPU相比有哪些优势或短板？

**线性王淮：能否"接棒"取决于大家对"棒"的期待是什么。如果期待像英伟达那样几年内涨数百倍，我个人认为有难度。**GPU这"一棒"太重了，其他东西很难接住这么大规模的棒。

但是，推理端对内存的需求确实在大幅提升，尤其是KV Cache、上下文窗口等，对内存的需求越来越高。长期来看，存储芯片的需求肯定是在提升的。短期看，所有与AI相关的标的在估值上都有泡沫，但AI本身的发展和需求并没有泡沫，依然在迅速推进。**现在是价格远远高于价值，但长期价值会追上来。**只要不出现重大地缘政治事件，这些股票长期价值会追着价格上升，不像纯炒作题材没有底层支撑。

至于成长空间的对比，存储芯片和GPU是协同关系，而不是简单的替代关系。推理端需要大内存GPU通过高速互联进行大量数据交换，这对光通信、互联技术也提出了更高需求。所以更可能的情况是存储、光通信等多个方向联手发展。

对于投资来说，这不是一个等待短期暴涨的逻辑，应该以更长期的视角来看待。 这几个方向都是巨大的成长板块，但短期内价格上是否存在泡沫、情绪定价有多严重，我并不清楚。

本文首发于《Barrons巴伦》

仅为个人技术观点分享，不构成任何投资建议