云启实干派 | MiniMax 闫俊杰对话罗永浩，4 小时深谈“难而正确”的事

云启资本·2025年12月15日·26·1

在没有共识之前，选择最难的那条路

在云启的投资记录里，有一些项目，是从还没有产品、没有共识、甚至还没真正创业的时候开始连接的。MiniMax，正是其中之一。

2021 年春天，云启投资团队结识了彼时尚未正式创办 MiniMax 的闫俊杰。那时还没有"大模型创业潮"，全模态、AGI 也远未成为行业热词，但他已经在反复推演一个问题：如果 foundation model 成立，AI 是否有可能成为真正通用、可规模化的产品？

几个月后，云启参与了 MiniMax 的天使轮投资，成为这家公司最早的早期投资机构。（点此查看云启创始合伙人毛丞宇与闫俊杰的深度对话）

四年多过去，行业环境、技术路径和竞争格局发生了剧烈变化。MiniMax 也从一家初创团队，成长为坚定押注全模态。在语言、音频、视频等多个方向持续推进并取得亮眼成绩的 AI 独角兽。回头看，这条路并不"好走"，甚至在很多阶段并不被理解，但它始终指向同一个判断：去做难而正确的事。

近日，闫俊杰做客《罗永浩的十字路口》，在长达 4 小时的深度对谈中，系统回顾了自己从科研、产业到创业的关键选择，和对技术路线、人才团队、组织形态的再思考。

这篇对话也再次提醒我们：**真正重要的，从来不是追逐风口，而是在时间里不断验证方向的能力。**以下为访谈节选。

以下内容转自"腾讯科技"

原标题：《MiniMax闫俊杰：中国不乏AI人才，但我们需要去做难而正确的事》

近日，MiniMax 稀宇科技创始人兼 CEO 闫俊杰做客《罗永浩的十字路口》节目，接受了长达 4 小时的访谈。

在节目中，闫俊杰和罗永浩聊了很多，从 MiniMax 为何押注全模态、公司的定位和价值体现，到 AI 时代的核心竞争力、人才差异等话题。通过观察者与AI从业者的双重视角，拆解了当前 AI 行业的发展趋势及其未来方向。

1989 年出生的闫俊杰，是中科院博士，曾做过百度AI研究院实习生、在实验中提前窥见AI的未来形态；后续进入商汤科技，带领 700 余人攻克面部识别算法，做到了行业第一。在做到商汤副总裁时选择 AIGC 技术迸发的节点辞职创业，成立了 MiniMax。如今，公开数据显示，公司估值超过 40 亿美元。

据全球权威测评榜单 Artificial Analysis 显示，MiniMax-M2 以 61 总分位居全球大语言模型第五、开源第一，整体性能达到全球第一梯队水平。

MiniMax-M2 是一款 10B 激活参数（总参数量230B）的轻量级模型，通过高效的 MoE（混合专家）架构实现低算力成本（仅为Claude4.5的8%），价格优势明显，上线一个多月 tokens 调用量已突破1万亿次。

值得一提的是，MiniMax 是一家从成立之初就押注全模态的AI独角兽，目前在语言模型、视频、音频赛道均做到全球领先（音频全球第一、视频第二），同时还孵化出Talkie、海螺视频等风靡海内外的 AI 原生应用，在大模型领域显得独树一帜。

随着竞争的白热化，AI 大模型已经从单纯的算力比拼转向更多维度、场景泛用性、硬件协同效率及部署成本均成为关键。面对行业变化，大批大模型初创企业转型或倒闭，而 MiniMax 则坚定全模态发展路线，这是闫俊杰和团队在公司创立之初就定下的基调。

闫俊杰认为，真正的 AGI（通用人工智能）一定是多模态输入和输出的，只是实现起来太难了，所以要先把每个模态先走通，在合适的时机进行整合。

"我们现在基本走通了，未来几个月将探索多模态融合。我觉得我们在全球范围内是比较少见的公司，也是有机会能做成（AGI）这件事的。"闫俊杰显得信心十足。做"难而正确"的事，正是 MiniMax 这家公司的生存之道。

本次访谈的核心观点如下：

·全模态发展并非"不聚焦"，而是实现 AGI 的必要途径。MiniMax 现在已经具备基础条件，未来将探索全模态融合。

·大模型时代，真正的产品就是模型本身，正在改变创意和生产力。随着大模型的进化，未来的应用形态能够服务于所有人，实现 MiniMax 的愿景"Intellience with Everyone"。

·技术驱动是 MiniMax 的核心竞争力之一，在此基础上专注国际化和直接服务客户，率先实现商业化落地，因此在融资方面非常顺利。

·对于中国 AI 公司来说，一定不是"拿来主义"，需要做本土的创新。

·AI 时代，最核心的竞争力是想象力。在未来AI竞争的关键节点，中国公司的挑战是如何发挥环境和人才优势，取得技术和话语权上的引领。

预见Scaling Law：

驱动闫俊杰创业的关键时刻

罗永浩： 你说你本来是要做老师的，怎么后来又去创业了？

闫俊杰： 我本科是东南大学数学系，后来去中科院自动化所硕博连读。硕博连读时主要就是写论文、搞科研，当时就觉得这个专业不太好找工作，以后就是当老师什么的。

转折点是2014年深度学习出来时，我当时在百度研究院实习，当时百度有国内最大的GPU集群，环境非常好。我当时可能用了他们三分之一的GPU来做实验，让我意识到AI真的可能会带来实际价值。

罗永浩： 所以其实你们提前看到了一些东西了，公众其实是 GPT 3.5 时才看到突破。

闫俊杰： 坦白说我觉得国内有点遗憾，其实当时 Anthropic 的 CEO 恰好在百度做语音，已经发现了Scaling Law（规模化法则或缩放定律）就是大模型里面最核心的原理，这件事是发生在中国公司的，（中国没做出来类似GPT 3.5的产品）很遗憾。

罗永浩： 后来你在读博士后时期就去商汤科技实习了是吧，又用很短的时间做到副总裁和 CTO（首席技术官），怎么实现的？

闫俊杰： 我觉得主要是承担了重要职责，大概用了一年半把面部识别技术做到了行业第一。

在这个过程中，让我意识到两件事，一是要做取舍，专注更加长期、能够引起质变的技术，而不是修补；其次就是再次意识到 Scaling Law 的重要性，因为以前每个模型只能做一件事、适配一个场景，但受限于资源和人手，就选择做一个相对全能的模型来应对所有情况，结果非常理想，这也成为驱动后来创业的原因之一。

全模态发展是AGI必由之路

国际领先的潜力更加突出

罗永浩： 你们十月份发布了新一轮的模型，"吹吹牛"吧，我是指真实的成绩。

闫俊杰： （笑）我们大概是在两年前的时候做到音频（模型）国际领先，一年前视频国际领先，但语言模型一直还没有做到国际领先。这次语言模型在国际上也比较受到认可，然后有很多开发者用它来做 Agent、来写代码，这个事儿我觉得是一个非常大的一个进展。

客观来看，我们几乎是中国唯一一家在语言模型、视频、音频领域，都做到国际领先的公司。

罗永浩： 还包括音乐吧？现在也是第一梯队。

闫俊杰： 对，三强之一。但其实这是一个很难的事（做全模态），外界就很奇怪一个创业公司什么都做，是不是"不聚焦"？

罗永浩： 是有很多人这么问么，不聚焦？

闫俊杰： 对。**其实我们一开始就想得比较清楚，真正的 AGI 一定是多模态输入和输出，只是实现起来非常困难。**我们的想法就是把每个模态先走通，找合适的时机再进行整合。比如 Open AI 的 Sora2 ，就是典型的多模态融合，获得了巨大的成功。

我觉得目前我们基本上具备了基础，每个模态都已经有了数据、使用场景，我希望在接下来几个月把它们整合到下一代模型里。我觉得在全球范围内，我们应该是少数有机会能够做成这件事的公司。

罗永浩： 但是跟国外的这些竞争对手比对，花的钱还是少了不知道多少倍。

闫俊杰： 对，这其实和中国固有的优势有关。我觉得最核心的一个点是，美国真正能做大模型的其实只有四家公司——谷歌、OpenAI、Anthropic 和 xAI。这些公司估值可能是中国公司的100倍，但是技术就领先5%，投入可能在50至100倍之间。

话说回来，为什么中国公司可以花他们五十分之一的钱就可以做出来，性能差距可能只有5%，甚至这个差距我认为在过去一年是在不断变小的，我觉得核心原因是因为中国人才是非常好的。

中国土壤将孕育出

本土顶级AI原生人才

闫俊杰： 现在中国有非常多优秀的年轻人，包括我们（公司）在内，还是能够有一种机制，将优秀的年轻人组合在一起，这是比较关键的。

当然，我在想如果中国的年轻人出来几个技术天才，会成为中国AI领域的一个突破点，我觉得可能两三年内会出现。

罗永浩： 对，一定会出现这样的人。

闫俊杰：并且这种人才一定在中国本土环境里成长的人，而不是美国回来的。

罗永浩：你们大部分人才都是本土的么？没有海归么？

闫俊杰： 我们有海归，但是真正在公司起到关键作用的人才，基本上都是来自本土，是他们的第一份工作。

罗永浩： 这个事情还挺很神奇的。按我的理解，在AI领域我们是学习和追随者，但是并不依赖海归华人也能搞定，像梁文锋（DeepSeek）那边一个海归都没有，这些年是发生了什么变化么？

闫俊杰： 我觉得人工智能不是玄学，可以用第一性原理来拆解，所以把每个技术部分做好并且持续积累，比如算法设计、数据链路搭建、训练效率优化等，就会看到好的结果，这是第一点。

其次是客观来看，中国算力相比美国差距较大，这种情况逼迫中国公司去创新，才能达到美国公司那样的效果。在大的原则上大家可能是一致的，但是中国技术在不同模块上都有创新，（与美国）又不完全一样。

天价挖人VS.本土创新

中美AI路径不尽相同

罗永浩： 前一阵子 Meta 的扎克伯格高薪挖人，上亿美元年薪，大家就觉得这个薪水很高。但如果结合这些人在 OpenAl 的工作经验来看，性价比是很高的，但前提Meta依然要提供足够的资源和资金供他们研究。那么这种"烧钱"的做法是不是对于我们来说就没那么实用？

闫俊杰： 对，我觉得这是一个很好的视角。我认为烧钱肯定有用，但仅仅烧钱又是不够的。对于中国AI公司来说，一定不是"拿来主义"，需要做本土的创新。

罗永浩： 还有一个趋势是过去硅谷的公司可能30%是华人、30%印度人；但现在硅谷AI公司华人的比例远高于印度人，这是个什么原因？

闫俊杰： 其实在 AI 这个领域一直是这样的。大概是十几年前，那个时候的AI前身是计算机视觉，在这个领域里华人占比就很多。来到大模型时代，华人占比就更多了。一是因为华人比较聪明，数学和编程能力较强，另外还需要长时间的努力，同时具备三种特点的人确实很多是中国人。

罗永浩： 刚起步的时候，是凭什么吸引到第一波愿意追随你的人？是你发表过的论文和学术成就，还是高工资？

闫俊杰：我觉得对他们来说，第一要素一定是他们是相信的，不是相信我，而是相信 AGI 本身。 对于优秀的人才来说，首先钱肯定是要到位的，但比钱更重要的是热爱，钱只能排第二。

客观来说，中国目前还没有伊利亚（Ilya Sutskever，OpenAI前首席科学家、联合创始人）那种最 TOP 级别的天才。中国有这样潜质的人，但暂时还没变成那样，那他能否在一个环境里变成那样，我觉得这件事对这些人才来说是更重要的。

大模型时代真正的产品是模型本身

罗永浩： 按我的理解，没有像你们押注全模态的公司是因为资源不够，是这样么？

闫俊杰： 我觉得不完全是，可能更多是取决于大家背后的出发点是不一样的。

罗永浩： 那是否跟你们的变现能力有关系？像你们这种纯科研的公司，能把C端产品做得那么好的不多。

闫俊杰： 其实就是把技术能力做好，做到行业需要你，商业化能力自然水到渠成。这里面的一个本质逻辑是"AI大模型本身就是产品，而通过模型做出来的产品（或者说应用），实际上是一种渠道。"

通过模型衍生出的应用形式，不管是面向 B 端还是 C 端市场都能实现其价值，便会受到市场的认可。比如视频模型，现在全球每天都产出上千万两级的视频，在创意领域就有很高的价值，这在半年以前还是无法实现的。

罗永浩： 这又涉及到一个问题，如果模型本身是产品，那么最强模型不就是通杀吗？如果是这样，那么整个行业是不是都会被颠覆，比如我们内部某个部门就都裁掉了？

闫俊杰： 其实过去几年我一直在想，首先我觉得每个职能都是有价值的。

罗永浩： 听着像安慰……

闫俊杰： 不是的。目前一个核心的原因是，还没有哪个模型是所有领域最好的，各自有不同的特点，比如说有的语言模型对话很流畅、有的写代码比较好等等。

罗永浩： 你不是说后面会融合，融合完了最强的就全通吃了么？

闫俊杰： 比如说还没有融合的时候，为什么那么多公司的模型都有人在用呢，而且大家的用户量都在增长。其实核心原因是一个经济行为，就像汽车一样，有很多品牌瓜分市场。不同公司的商业属性也不同，所以会有差异。

所以说，其实大家都会有自己的生存空间，并且模型能力越强、商业价值越大，整个市场是越来越大的。

AI 不是互联网的延伸

而是新的生产力

罗永浩： 因为大模型的能力越来越强，都说很多职位会被取代，我觉得产品经理的未来可能一面是天堂、一面是地狱。你给我们产品经理把把脉，未来出路在哪？

闫俊杰： 我猜一定会出现一种新的形势。根据我的观察，一个明显变化是现在产品经理可以借助AI写代码直接拿出 Demo 而不是 PRD（产品需求文档），工程师如果有好的想法也可以做出很有创意的产品。

AI的出现很大程度上同时降低了做创意和生产力的门槛，本质上是将核心竞争力从技能转变成"想象力" ，不再受限于谁只会写代码、做产品或是做算法的约束去掉了。

罗永浩： 所以你的意思是，将来一个很小的公司也能做成很大的事，创始人可能是产品经理出身、也可能是工程师出身？

闫俊杰： 对，AI 作为工具大幅降低了做生产力的门槛，所以本质上核心竞争力就变成了"想象力"。

从理论上来说，谁有最好的想象力、谁能坚持，然后产品出来对社会价值更大，那就会获得成功。

我现在的理解是AI行业不应该是互联网的延续，从这个角度来说就不必在意移动互联网时代的分工。其实我们自己也有这种感觉，就是做出来成功的模型比我本人聪明，就会感觉有点害怕（笑）。

AI Native 公司的

人才观和组织创新

**罗永浩：**DeepSeek爆火之后，你们从春节开始到现在也快一年了，这期间工作上有什么调整么？

闫俊杰： 有，其实是有一个非常大的调整，因为我们这种公司必须每年都有进步，不进步就可能挂掉了。**DeepSeek 让我们意识到算法和基础设施一定要是一体的，相当于一定是所有人要优化一个目标而不是分散的。**这件事其实让我们的组织上发生了非常大的变化。

罗永浩： 这么大的调整？你们内部是用 OKR（目标与关键成果法）吗？

闫俊杰： 对，这就是一个典型的例子，我们曾经试过 OKR，但发现根本行不通。这也是为什么我说 AI 行业不是互联网行业的自然延伸，它是一个新的行业。

**罗永浩：**KPI 呢，更行不通吧。

闫俊杰： 行不通，所以我们没有组织工具。

罗永浩： 那如果公司到了几千人规模如何管理？

闫俊杰：我认为 AI Native 公司（原生 AI 公司）的组织和大模型有相同之处，几种不同画像的人才对应"多模态"，能够在基于底层原则的情况下进行排列组合，产生更丰富、更多样化的东西。

当然对于人才筛选肯定是有底层原则的，第一是足够聪明，能够有悟性，自我学习，主动发现；第二有热情，热情是没有办法被表演的；第三，这个领域没法个人英雄主义，需要很多人合作，需要很好的合作能力。

在这个基础上，我觉得一个人在不同阶段承担的职责不应该再遵循互联网的定义，而是通过组织创新更灵活地用人，在不同阶段实现不同排列组合。如果我们没有做一些组织上的创新，那么很多模型是做不出来的。

罗永浩： 公司有没有遇到特别困难的时候，如何提升士气？

闫俊杰： 士气低迷的时候，通常需要用第一性原理拆解，让大家接受这件事是可行的。其次就是给大家发更多的钱，让努力获得反馈。我觉得背后的意义在于大家在一起有希望，即便是遇到挫折，也还是能够做更好的东西。

三个原则

驱动MiniMax不断前进

罗永浩： 我觉得你们公司让外界看不明白的一点是，你们明显是一个技术型驱动公司，那么为什么做出了好几个成功的 To C 产品？

闫俊杰： 首先我们有非常好的产品经理，对技术理解很深、产品能力也很强。另外，公司成立之初定下三个原则：技术驱动、直接服务客户和国际化，到今天我们也是在坚持的。

技术驱动对于我们来说其实是最难的。通过模型能力赋能业务或产品，和直接复制移动互联网已有的成功案例，这两种路线可能都是正确的、但无法共存，我们后来意识到只有技术驱动是更适合我们的。

罗永浩： 所以你们融资非常顺利，上一轮估值超40亿美元了吧。

闫俊杰：这里面的两个逻辑第一个是技术的领先性，第二是技术领先后能够带来的收入跳变。 从公司经营层面来看，我们一直在优化这两个目标，并且每次实现后，规模和量级都实现了很大的增长。因此，我们对股东、员工的严肃承诺几乎都实现了，后续融资自然更加顺利。

罗永浩： 最后一个问题。公司做到了现在这个阶段，你的终极愿景是什么？

闫俊杰： 我思考的更多是两个问题。一是 AGI 行业什么时候能够真正带来 GDP 上的变化；其次是目前行业还是美国公司引领，如果到了关键节点，中国公司能否实现超越。

我觉得中国已经有这个环境了，但是中国的 AI 人才需要更加自信地成长起来，我希望在三年内看到变化吧。