云启实干派 | MiniMax 闫俊杰对话罗永浩,4 小时深谈“难而正确”的事

云启资本·2025年12月15日

在没有共识之前,选择最难的那条路

在云启的投资记录里,有一些项目,是从还没有产品、没有共识、甚至还没真正创业的时候开始连接的。MiniMax,正是其中之一

2021 年春天,云启投资团队结识了彼时尚未正式创办 MiniMax 的闫俊杰。那时还没有"大模型创业潮",全模态、AGI 也远未成为行业热词,但他已经在反复推演一个问题:如果 foundation model 成立,AI 是否有可能成为真正通用、可规模化的产品?

几个月后,云启参与了 MiniMax 的天使轮投资,成为这家公司最早的早期投资机构。(点此查看云启创始合伙人毛丞宇与闫俊杰的深度对话

四年多过去,行业环境、技术路径和竞争格局发生了剧烈变化。MiniMax 也从一家初创团队,成长为坚定押注全模态。在语言、音频、视频等多个方向持续推进并取得亮眼成绩的 AI 独角兽。回头看,这条路并不"好走",甚至在很多阶段并不被理解,但它始终指向同一个判断:去做难而正确的事。

近日,闫俊杰做客《罗永浩的十字路口》,在长达 4 小时的深度对谈中,系统回顾了自己从科研、产业到创业的关键选择,和对技术路线、人才团队、组织形态的再思考。

这篇对话也再次提醒我们:**真正重要的,从来不是追逐风口,而是在时间里不断验证方向的能力。**以下为访谈节选。

以下内容转自"腾讯科技"

原标题:《MiniMax闫俊杰:中国不乏AI人才,但我们需要去做难而正确的事》

近日,MiniMax 稀宇科技创始人兼 CEO 闫俊杰做客《罗永浩的十字路口》节目,接受了长达 4 小时的访谈。

在节目中,闫俊杰和罗永浩聊了很多,从 MiniMax 为何押注全模态、公司的定位和价值体现,到 AI 时代的核心竞争力、人才差异等话题。通过观察者与AI从业者的双重视角,拆解了当前 AI 行业的发展趋势及其未来方向。

1989 年出生的闫俊杰,是中科院博士,曾做过百度AI研究院实习生、在实验中提前窥见AI的未来形态;后续进入商汤科技,带领 700 余人攻克面部识别算法,做到了行业第一。在做到商汤副总裁时选择 AIGC 技术迸发的节点辞职创业,成立了 MiniMax。如今,公开数据显示,公司估值超过 40 亿美元。

据全球权威测评榜单 Artificial Analysis 显示,MiniMax-M2 以 61 总分位居全球大语言模型第五、开源第一,整体性能达到全球第一梯队水平。

MiniMax-M2 是一款 10B 激活参数(总参数量230B)的轻量级模型,通过高效的 MoE(混合专家)架构实现低算力成本(仅为Claude4.5的8%),价格优势明显,上线一个多月 tokens 调用量已突破1万亿次。

值得一提的是,MiniMax 是一家从成立之初就押注全模态的AI独角兽,目前在语言模型、视频、音频赛道均做到全球领先(音频全球第一、视频第二),同时还孵化出Talkie、海螺视频等风靡海内外的 AI 原生应用,在大模型领域显得独树一帜。

随着竞争的白热化,AI 大模型已经从单纯的算力比拼转向更多维度、场景泛用性、硬件协同效率及部署成本均成为关键。面对行业变化,大批大模型初创企业转型或倒闭,而 MiniMax 则坚定全模态发展路线,这是闫俊杰和团队在公司创立之初就定下的基调。

闫俊杰认为,真正的 AGI(通用人工智能)一定是多模态输入和输出的,只是实现起来太难了,所以要先把每个模态先走通,在合适的时机进行整合。

"我们现在基本走通了,未来几个月将探索多模态融合。我觉得我们在全球范围内是比较少见的公司,也是有机会能做成(AGI)这件事的。"闫俊杰显得信心十足。做"难而正确"的事,正是 MiniMax 这家公司的生存之道。

本次访谈的核心观点如下:

·全模态发展并非"不聚焦",而是实现 AGI 的必要途径。MiniMax 现在已经具备基础条件,未来将探索全模态融合。

·大模型时代,真正的产品就是模型本身,正在改变创意和生产力。随着大模型的进化,未来的应用形态能够服务于所有人,实现 MiniMax 的愿景"Intellience with Everyone"。

·技术驱动是 MiniMax 的核心竞争力之一,在此基础上专注国际化和直接服务客户,率先实现商业化落地,因此在融资方面非常顺利。

·对于中国 AI 公司来说,一定不是"拿来主义",需要做本土的创新。

·AI 时代,最核心的竞争力是想象力。在未来AI竞争的关键节点,中国公司的挑战是如何发挥环境和人才优势,取得技术和话语权上的引领。

预见Scaling Law:

驱动闫俊杰创业的关键时刻

罗永浩: 你说你本来是要做老师的,怎么后来又去创业了?

闫俊杰: 我本科是东南大学数学系,后来去中科院自动化所硕博连读。硕博连读时主要就是写论文、搞科研,当时就觉得这个专业不太好找工作,以后就是当老师什么的。

转折点是2014年深度学习出来时,我当时在百度研究院实习,当时百度有国内最大的GPU集群,环境非常好。我当时可能用了他们三分之一的GPU来做实验,让我意识到AI真的可能会带来实际价值。

罗永浩: 所以其实你们提前看到了一些东西了,公众其实是 GPT 3.5 时才看到突破。

闫俊杰: 坦白说我觉得国内有点遗憾,其实当时 Anthropic 的 CEO 恰好在百度做语音,已经发现了Scaling Law(规模化法则或缩放定律)就是大模型里面最核心的原理,这件事是发生在中国公司的,(中国没做出来类似GPT 3.5的产品)很遗憾。

罗永浩: 后来你在读博士后时期就去商汤科技实习了是吧,又用很短的时间做到副总裁和 CTO(首席技术官),怎么实现的?

闫俊杰: 我觉得主要是承担了重要职责,大概用了一年半把面部识别技术做到了行业第一。

在这个过程中,让我意识到两件事,一是要做取舍,专注更加长期、能够引起质变的技术,而不是修补;其次就是再次意识到 Scaling Law 的重要性,因为以前每个模型只能做一件事、适配一个场景,但受限于资源和人手,就选择做一个相对全能的模型来应对所有情况,结果非常理想,这也成为驱动后来创业的原因之一。

全模态发展是AGI必由之路

国际领先的潜力更加突出

罗永浩: 你们十月份发布了新一轮的模型,"吹吹牛"吧,我是指真实的成绩。

闫俊杰: (笑)我们大概是在两年前的时候做到音频(模型)国际领先,一年前视频国际领先,但语言模型一直还没有做到国际领先。这次语言模型在国际上也比较受到认可,然后有很多开发者用它来做 Agent、来写代码,这个事儿我觉得是一个非常大的一个进展。

客观来看,我们几乎是中国唯一一家在语言模型 、视频、音频领域,都做到国际领先的公司。

罗永浩: 还包括音乐吧?现在也是第一梯队。

闫俊杰: 对,三强之一。但其实这是一个很难的事(做全模态),外界就很奇怪一个创业公司什么都做,是不是"不聚焦"?

罗永浩: 是有很多人这么问么,不聚焦?

闫俊杰: 对。**其实我们一开始就想得比较清楚,真正的 AGI 一定是多模态输入和输出,只是实现起来非常困难。**我们的想法就是把每个模态先走通,找合适的时机再进行整合。比如 Open AI 的 Sora2 ,就是典型的多模态融合 ,获得了巨大的成功。

我觉得目前我们基本上具备了基础,每个模态都已经有了数据、使用场景,我希望在接下来几个月把它们整合到下一代模型里。我觉得在全球范围内,我们应该是少数有机会能够做成这件事的公司。

罗永浩: 但是跟国外的这些竞争对手比对,花的钱还是少了不知道多少倍。

闫俊杰: 对,这其实和中国固有的优势有关。我觉得最核心的一个点是,美国真正能做大模型的其实只有四家公司——谷歌、OpenAI、Anthropic 和 xAI。这些公司估值可能是中国公司的100倍,但是技术就领先5%,投入可能在50至100倍之间。

话说回来,为什么中国公司可以花他们五十分之一的钱就可以做出来,性能差距可能只有5%,甚至这个差距我认为在过去一年是在不断变小的,我觉得核心原因是因为中国人才是非常好的。

中国土壤将孕育出

本土顶级AI原生人才

闫俊杰: 现在中国有非常多优秀的年轻人,包括我们(公司)在内,还是能够有一种机制,将优秀的年轻人组合在一起,这是比较关键的。

当然,我在想如果中国的年轻人出来几个技术天才,会成为中国AI领域的一个突破点,我觉得可能两三年内会出现。

罗永浩: 对,一定会出现这样的人。

闫俊杰:并且这种人才一定在中国本土环境里成长的人,而不是美国回来的。

罗永浩:你们大部分人才都是本土的么?没有海归么?

闫俊杰: 我们有海归,但是真正在公司起到关键作用的人才,基本上都是来自本土,是他们的第一份工作。

罗永浩: 这个事情还挺很神奇的。按我的理解,在AI领域我们是学习和追随者,但是并不依赖海归华人也能搞定,像梁文锋(DeepSeek)那边一个海归都没有,这些年是发生了什么变化么?

闫俊杰: 我觉得人工智能不是玄学,可以用第一性原理来拆解,所以把每个技术部分做好并且持续积累,比如算法设计、数据链路搭建、训练效率优化等,就会看到好的结果,这是第一点。

其次是客观来看,中国算力相比美国差距较大,这种情况逼迫中国公司去创新,才能达到美国公司那样的效果。在大的原则上大家可能是一致的,但是中国技术在不同模块上都有创新,(与美国)又不完全一样。

天价挖人VS.本土创新

中美AI路径不尽相同

罗永浩: 前一阵子 Meta 的扎克伯格高薪挖人,上亿美元年薪,大家就觉得这个薪水很高。但如果结合这些人在 OpenAl 的工作经验来看,性价比是很高的,但前提Meta依然要提供足够的资源和资金供他们研究。那么这种"烧钱"的做法是不是对于我们来说就没那么实用?

闫俊杰: 对,我觉得这是一个很好的视角。我认为烧钱肯定有用,但仅仅烧钱又是不够的。对于中国AI公司来说,一定不是"拿来主义",需要做本土的创新。

罗永浩: 还有一个趋势是过去硅谷的公司可能30%是华人、30%印度人;但现在硅谷AI公司华人的比例远高于印度人,这是个什么原因?

闫俊杰: 其实在 AI 这个领域一直是这样的。大概是十几年前,那个时候的AI前身是计算机视觉,在这个领域里华人占比就很多。来到大模型时代,华人占比就更多了。一是因为华人比较聪明,数学和编程能力较强,另外还需要长时间的努力,同时具备三种特点的人确实很多是中国人。

罗永浩: 刚起步的时候,是凭什么吸引到第一波愿意追随你的人?是你发表过的论文和学术成就,还是高工资?

闫俊杰:我觉得对他们来说,第一要素一定是他们是相信的,不是相信我,而是相信 AGI 本身。 对于优秀的人才来说,首先钱肯定是要到位的,但比钱更重要的是热爱,钱只能排第二。

客观来说,中国目前还没有伊利亚(Ilya Sutskever,OpenAI前首席科学家、联合创始人)那种最 TOP 级别的天才。中国有这样潜质的人,但暂时还没变成那样,那他能否在一个环境里变成那样,我觉得这件事对这些人才来说是更重要的。

大模型时代真正的产品是模型本身

罗永浩: 按我的理解,没有像你们押注全模态的公司是因为资源不够,是这样么?

闫俊杰: 我觉得不完全是,可能更多是取决于大家背后的出发点是不一样的。

罗永浩: 那是否跟你们的变现能力有关系?像你们这种纯科研的公司,能把C端产品做得那么好的不多。

闫俊杰: 其实就是把技术能力做好,做到行业需要你,商业化能力自然水到渠成。这里面的一个本质逻辑是"AI大模型本身就是产品,而通过模型做出来的产品(或者说应用),实际上是一种渠道。"

通过模型衍生出的应用形式,不管是面向 B 端还是 C 端市场都能实现其价值,便会受到市场的认可。比如视频模型,现在全球每天都产出上千万两级的视频,在创意领域就有很高的价值,这在半年以前还是无法实现的。

罗永浩: 这又涉及到一个问题,如果模型本身是产品,那么最强模型不就是通杀吗?如果是这样,那么整个行业是不是都会被颠覆,比如我们内部某个部门就都裁掉了?

闫俊杰: 其实过去几年我一直在想,首先我觉得每个职能都是有价值的。

罗永浩: 听着像安慰……

闫俊杰: 不是的。目前一个核心的原因是,还没有哪个模型是所有领域最好的,各自有不同的特点,比如说有的语言模型对话很流畅、有的写代码比较好等等。

罗永浩: 你不是说后面会融合,融合完了最强的就全通吃了么?

闫俊杰: 比如说还没有融合的时候,为什么那么多公司的模型都有人在用呢,而且大家的用户量都在增长。其实核心原因是一个经济行为,就像汽车一样,有很多品牌瓜分市场。不同公司的商业属性也不同,所以会有差异。

所以说,其实大家都会有自己的生存空间,并且模型能力越强、商业价值越大,整个市场是越来越大的。

AI 不是互联网的延伸

而是新的生产力

罗永浩: 因为大模型的能力越来越强,都说很多职位会被取代,我觉得产品经理的未来可能一面是天堂、一面是地狱。你给我们产品经理把把脉,未来出路在哪?

闫俊杰: 我猜一定会出现一种新的形势。根据我的观察,一个明显变化是现在产品经理可以借助AI写代码直接拿出 Demo 而不是 PRD(产品需求文档),工程师如果有好的想法也可以做出很有创意的产品。

AI的出现很大程度上同时降低了做创意和生产力的门槛,本质上是将核心竞争力从技能转变成"想象力" ,不再受限于谁只会写代码、做产品或是做算法的约束去掉了。

罗永浩: 所以你的意思是,将来一个很小的公司也能做成很大的事,创始人可能是产品经理出身、也可能是工程师出身?

闫俊杰: 对,AI 作为工具大幅降低了做生产力的门槛,所以本质上核心竞争力就变成了"想象力"。

从理论上来说,谁有最好的想象力、谁能坚持,然后产品出来对社会价值更大,那就会获得成功。

我现在的理解是AI行业不应该是互联网的延续,从这个角度来说就不必在意移动互联网时代的分工。其实我们自己也有这种感觉,就是做出来成功的模型比我本人聪明,就会感觉有点害怕(笑)。

AI Native 公司的

人才观和组织创新

**罗永浩:**DeepSeek爆火之后,你们从春节开始到现在也快一年了,这期间工作上有什么调整么?

闫俊杰: 有,其实是有一个非常大的调整,因为我们这种公司必须每年都有进步,不进步就可能挂掉了。**DeepSeek 让我们意识到算法和基础设施一定要是一体的,相当于一定是所有人要优化一个目标而不是分散的。**这件事其实让我们的组织上发生了非常大的变化。

罗永浩: 这么大的调整?你们内部是用 OKR(目标与关键成果法)吗?

闫俊杰: 对,这就是一个典型的例子,我们曾经试过 OKR,但发现根本行不通。这也是为什么我说 AI 行业不是互联网行业的自然延伸,它是一个新的行业。

**罗永浩:**KPI 呢,更行不通吧。

闫俊杰: 行不通,所以我们没有组织工具。

罗永浩: 那如果公司到了几千人规模如何管理?

闫俊杰:我认为 AI Native 公司(原生 AI 公司)的组织和大模型有相同之处,几种不同画像的人才对应"多模态",能够在基于底层原则的情况下进行排列组合,产生更丰富、更多样化的东西。

当然对于人才筛选肯定是有底层原则的,第一是足够聪明,能够有悟性,自我学习,主动发现;第二有热情,热情是没有办法被表演的;第三,这个领域没法个人英雄主义,需要很多人合作,需要很好的合作能力。

在这个基础上,我觉得一个人在不同阶段承担的职责不应该再遵循互联网的定义,而是通过组织创新更灵活地用人,在不同阶段实现不同排列组合。如果我们没有做一些组织上的创新,那么很多模型是做不出来的。

罗永浩: 公司有没有遇到特别困难的时候,如何提升士气?

闫俊杰: 士气低迷的时候,通常需要用第一性原理拆解,让大家接受这件事是可行的。其次就是给大家发更多的钱,让努力获得反馈。我觉得背后的意义在于大家在一起有希望,即便是遇到挫折,也还是能够做更好的东西。

三个原则

驱动MiniMax不断前进

罗永浩: 我觉得你们公司让外界看不明白的一点是,你们明显是一个技术型驱动公司,那么为什么做出了好几个成功的 To C 产品?

闫俊杰: 首先我们有非常好的产品经理,对技术理解很深、产品能力也很强。另外,公司成立之初定下三个原则:技术驱动、直接服务客户和国际化,到今天我们也是在坚持的。

技术驱动对于我们来说其实是最难的。通过模型能力赋能业务或产品,和直接复制移动互联网已有的成功案例,这两种路线可能都是正确的、但无法共存,我们后来意识到只有技术驱动是更适合我们的。

罗永浩: 所以你们融资非常顺利,上一轮估值超40亿美元了吧。

闫俊杰:这里面的两个逻辑第一个是技术的领先性,第二是技术领先后能够带来的收入跳变。 从公司经营层面来看,我们一直在优化这两个目标,并且每次实现后,规模和量级都实现了很大的增长。因此,我们对股东、员工的严肃承诺几乎都实现了,后续融资自然更加顺利。

罗永浩: 最后一个问题。公司做到了现在这个阶段,你的终极愿景是什么?

闫俊杰: 我思考的更多是两个问题。一是 AGI 行业什么时候能够真正带来 GDP 上的变化;其次是目前行业还是美国公司引领,如果到了关键节点,中国公司能否实现超越。

我觉得中国已经有这个环境了,但是中国的 AI 人才需要更加自信地成长起来,我希望在三年内看到变化吧。