全球半导体行业股价暴涨后,AI算力的下一个十年属于谁? | Linear View

线性资本线性资本·2026年6月3日

股价是情绪投票器,产业才是价值称重机。

近段时间,全球二级市场的半导体板块出现剧烈波动,个股也呈现出分化走势。但在股价涨跌的表象之下,一个更深层的产业命题正在浮出水面:AI的算力重心,是否正在从训练转向推理?

5月26日,线性资本创始人兼CEO王淮受邀参与**《巴伦菁英月谈会》**,抛开短期股价波动的表象,从技术本质和产业趋势出发,对ARM与x86的架构之争、英伟达CUDA生态的真实壁垒、训练与推理算力格局的演变,以及存储芯片与GPU的协同关系,给出了系统而深入的解读。

以下为当天直播内容的部分实录,仅为个人技术观点分享,不构成任何投资建议,欢迎大家讨论。

近期全球二级市场半导体板块异动显著。单纯从股价涨跌看,这似乎又是一次资金轮动下的短期博弈;但如果将视线从K线图移开,深入芯片设计的底层逻辑,会发现二级市场的这些异动,其实折射出一个正在加速演变的产业命题:

AI的核心算力需求,是否正在从训练端转向端侧推理? 如果是,这将如何重塑从指令集架构、芯片设计到生态格局的整个技术版图?

ARM的暴涨究竟是短期财报催化的情绪爆发,还是RISC(精简指令集)在AI推理时代价值重估的起点?英伟达的CUDA生态是否真的牢不可破——在训练端或许如此,但在推理端,AMD、谷歌、微软的自研芯片又能撕开多大的缺口?当推理算力负载已经超过训练,未来更将占到七至八成,这对芯片的功耗、成本、内存带宽和异构设计又提出了哪些全新的技术挑战?

这些问题,可能无法通过复盘资金流向或解读技术图表来回答。它们需要回到技术的源头,从指令集、架构设计、生态护城河等底层逻辑出发,才能找到真正有意义的答案。

**巴伦孙骋:**ARM单周暴涨42.58%,市场核心交易逻辑是"AI从训练转向端侧推理,ARM架构将大幅受益"。所以从技术角度分析,ARM的指令集和授权模式在AI推理场景中相比x86有哪些本质优势?这一轮价值重估是短期财报催化,还是产业长期拐点?

线性王淮: 从技术层面看,市场现在转向以端侧推理为主的AI算力应用,这个大逻辑是比较明显的。ARM比x86更适合端侧的核心原因有三点:

第一,指令集优势。ARM是RISC(精简指令集),x86是CISC(复杂指令集)。RISC不需要将流水线设计得过于复杂,因此相同芯片面积下可以集成更多核心、缓存或专用加速单元,有利于近内存计算。在AI推理中,一个重大瓶颈就是内存通信。ARM具有灵活的物理IP和定制化能力,天然适合AI推理运算。在典型端侧负载下,ARM架构能效显著优于x86,功耗通常可低近一半,带来巨大的成本优势。

第二,授权模式优势。ARM是IP授权模式,客户可以在拿到授权后做定制化设计,比如将CPU与GPU、NPU如何配合,可以自由操作。而x86是一个"黑盒子",很难在其基础上做异构分层的优化设计。这种开放性使得ARM在设计高带宽内存(LPDDR)整合时更受欢迎。

第三,矩阵运算优化。Transformer模型中用到最多的矩阵乘法,在ARM上的优化比x86高效得多。x86虽然也能高效做矩阵乘法,但想要达到相同吞吐的能效和面积效率,就不如ARM的向量方案,在端侧不划算。如果你关心兼容性和成熟度,可以选择x86;但如果关心性价比和功耗(未来巨大的成本选项),ARM优势明显。

从产业趋势看,AI正从训练转向推理,尤其是向Agentic AI发展。 这不仅是大模型对话,还涉及大量API调用、网络和文件调用,这些都依赖CPU。ARM作为CPU,在端侧(PC、手机、汽车等)的Agentic AI应用中充满期待。

我认为大方向是对的,产业拐点的认识已经形成。但短期股价波动会非常大,长期看这些大方向的落地会夯实价值。长期是称重机,短期是情绪投票器。

巴伦孙骋: 英伟达上周(5月18日那周)下跌2.58%,市场担忧其增长放缓。AMD上涨3.60%。在AI芯片领域,英伟达的CUDA生态护城河是否依然牢固?AMD的MI系列GPU在推理场景中能否缩小差距?客户自研芯片对英伟达的威胁有多大?

线性王淮:在训练端,目前没有人能撼动英伟达的地位。 但随着大模型普及和Agentic AI的发展,推理端算力需求大幅提升,这给了其他玩家机会。推理端的需求更加复杂,需要CPU、GPU、NPU等异构架构协同设计,对内存要求也很高。这让AMD等厂商真正获得了分一杯羹的机会。

AMD在推理端肯定会受益于"天下苦英伟达久矣"的情绪。企业需要一个可靠的第二供应商来保证供应链安全,避免被单一供应商卡脖子。因此,只要有一个可行的第二供应商出现,客户就会给予额外倾斜。AMD数据中心业务增速显著,但整体营收增长仍远低于股价涨幅,这当中当然有情绪波动的因素在,但市场对推理端巨大机会的释放是真实的。

对于英伟达,推理端的销售多少会受到影响,但并非致命。CUDA的护城河不是一天两天能被轻易超越的。 同时,谷歌、微软、亚马逊等都在自研推理芯片,一方面是减少对单一供应商的依赖,另一方面是可以针对自己擅长的场景做定制化异构设计。这个趋势很明显。但最泛用的、通用性最强的芯片仍然是英伟达。未来两三年,即使在推理端,英伟达仍然会占据主要份额,只是集中度不会像训练端那么高。训练端可能短期内没有实质性挑战者。

巴伦孙骋: 市场观点认为,AI投资正从"训练算力"转向"推理应用"。从实际部署来看,当前全球AI工作负载中训练与推理的比例大概是多少? 未来两年推理占比会如何变化?这种切换对芯片设计、存储带宽、功耗等提出了哪些新的技术挑战?

线性王淮: 我查阅了一些报告,目前推理与训练所占用的算力负载比例大约在6:4或5.5:4.5,推理已经超过了训练。 但资本支出(Capex)是反过来的,训练仍占六成,推理占四成,因为训练所需的超级节点成本更高。

未来推理占比会大幅提升。 一方面,大模型应用在全球的普及率其实还很低。数据显示,地球上从未接触过大模型应用的人还占86%。除了中美两国,很多国家的大模型应用很少。另一方面,Agentic AI会大幅增加对大模型的调用次数。未来三到五年,推理算力占比达到七到八成是完全有可能的。

另一个原因是**训练端的迭代速度在大幅放缓。**能做大型模型训练的公司正在集中,越来越少的企业负担得起训练成本。竞争减少后,企业会更倾向于将现有模型商业化变现,而不是快速推出新模型。训练端算力需求相对降低。除非未来具身智能或世界模型等领域出现新的万卡级别训练突破,那可能成为新的变量。

这种从训练到推理的切换,对芯片设计提出了更高要求。 推理端对成本、功耗和延迟极为敏感,且需要适配从云到端的多样化场景,这就为不同架构(如GPU、ASIC、CPU)提供了细分切入机会。对内存带宽和上下文缓存(KV Cache)的要求也比训练端更加复杂。这些技术挑战恰恰给了ARM这类架构和存储芯片更多的市场机会。

**巴伦孙骋:**AI服务器需求爆发,有观点认为"AI存储芯片将接力GPU成为行情新引擎"。你认为存储芯片能否真正接棒?其成长空间与GPU相比有哪些优势或短板?

**线性王淮:能否"接棒"取决于大家对"棒"的期待是什么。如果期待像英伟达那样几年内涨数百倍,我个人认为有难度。**GPU这"一棒"太重了,其他东西很难接住这么大规模的棒。

但是,推理端对内存的需求确实在大幅提升,尤其是KV Cache、上下文窗口等,对内存的需求越来越高。长期来看,存储芯片的需求肯定是在提升的。短期看,所有与AI相关的标的在估值上都有泡沫,但AI本身的发展和需求并没有泡沫,依然在迅速推进。**现在是价格远远高于价值,但长期价值会追上来。**只要不出现重大地缘政治事件,这些股票长期价值会追着价格上升,不像纯炒作题材没有底层支撑。

至于成长空间的对比,存储芯片和GPU是协同关系,而不是简单的替代关系。推理端需要大内存GPU通过高速互联进行大量数据交换,这对光通信、互联技术也提出了更高需求。所以更可能的情况是存储、光通信等多个方向联手发展。

对于投资来说,这不是一个等待短期暴涨的逻辑,应该以更长期的视角来看待。 这几个方向都是巨大的成长板块,但短期内价格上是否存在泡沫、情绪定价有多严重,我并不清楚。

本文首发于《Barrons巴伦》

仅为个人技术观点分享,不构成任何投资建议