生数是家好公司(附真诚道歉信)

葬AI葬AI·2026年6月15日

学生气太好

「学生气太好」

早上发完稿子后,收到了生数对我们的严厉批评,投诉我们侵犯企业商誉,导致原文暂时无法阅读。

于是我们用极其谦卑的心情重新学习生数的所有产品,结论是生数不仅吃的都是鹅腿,而且一家彻彻底底的好公司。

我们为此修改了全文,并在结尾附上了道歉信:

首先在2026年6月,打开VIdu的网站,映入眼帘的是他们的全新功能ViduClaw。

而且他们真的还在坚持更新这个文档

华北地区最后的龙虾信徒,OpenClaw最后的兵。

连之前天天全国巡演办龙虾气功热活动的那拨人现在都收手了,你还在这「龙虾、我的龙虾」呢。

这完全说明生数对OpenClaw有着超乎常人的坚定判断。 在人人不再炒作龙虾的当下,这大概就是创业者体现非共识的水平所在吧。

而且Vidu是真的想把这个ViduClaw作为入口,不管我点进什么页面,他都要跳出来个弹窗啥的提醒我:快来试试咱们最新研发的小龙虾功能吧。

盛情难却啊。于是连OpenClaw都没部署过的我,只能胆战心惊地尝试体验这个时髦功能。

结果发现还好,就是个对话框,也不用自己部署。

虽然我不理解这玩意存在的意义,但Vidu这么做一定有它的道理。在Vidu的文档里,他们如此描述ViduClaw和其他模型产品的差异:

自然语言对话、一句话生成……差点以为现在是Stable diffusion时代呢?现在市面上哪家产品不能通过说人话来生成视频?哪个视频模型不内置Agent模式?

我懂了,这肯定也是他们的非共识判断。

否则Vidu干嘛把其他模型产品封装好的功能给解压了,变成了Skills上传到GitHub上,让用户自己按需下载。

而这一切的一切都只为了和愚钝的我们炫耀一句:是不是挺难的?

那生数你全赢了啊,我输了啊,我平凡的大脑确实用不明白精英的龙虾,我只能玩明白那些给我安排得明明白白的傻瓜产品😭

无论如何,我还是试了试,想让ViduClaw批量给我做几集鹅腿阿姨的短剧。

结果它管我要提示词,让我在这填表。

属于是把我当学生,把自己当辅导员了。非常的好啊。

没办法,我只能用Claude生成了提示词发给它,结果:

对的,无论我如何修改提示词,ViduClaw都坚称这是违规内容不能生成。

安全生产不是问题。但我用同样的提示词在即梦、可灵、PixVerse都畅行无阻啊。

不过当我不使用它这个ViduClaw,而是换成普通的文生视频功能之后,这视频也就顺利生成了。

难道它的龙虾是个安全审核员啊?

我给Vidu提供的故事是:一个CBD国贸精英打工人举着满屏绿色的手机去问鹅腿阿姨,为啥自己的股票绿了,阿姨说,这是绿色新能源汁浸泡腌制形成的无任何危害。

已获得授权

我批量生成了3个视频,其中最能看的成品如下:

你们自己看吧。毕竟Vidu宣称自己「为剧而生」「声画同出」,所以我对角色说台词、对口型还是抱有很大期待的。

结果生成的每个视频,角色的口型都对不上,台词和人物也对不上,还经常胡言乱语。

至于什么角色的动作、物体的稳定性、背景的细节,那更是完全没有任何评价的意义。

反正我认为生成质量非常好。

我本来还想生数为什么不直接学隔壁PixVerse去做世界模型得了,换个赛道大家心里都舒服点。

哦,原来生数「首个登顶两大权威具身智能评测的通用世界行动模型Motubrain」已经在路上了。我的期待值已经拉满。

为了客观评测,我也把相同的提示词让PixVerse和即梦都试了一下。

PixVerse:

其实口型对的也一般,但起码是对应的人在说话,而且动作也都凑合能看。

即梦:

AI感是有的,也不能说完美,但至少在动作和口型上都没出问题。可能得做成这样才能宣传「为(AI短)剧而生」吧。

所以Vidu说自己「为剧而生」的底气来自于何处呢?

经过仔细思索,我觉得可能是视频长度。

现在主流的视频模型,无论是即梦、可灵还是PixVerse,单次生成视频的极限一般都是15秒。

咱们Vidu呢,偏偏就是16秒,以一秒之差傲视群雄。

感觉他们可以找岳云鹏当代言人,然后高歌一曲,啊16秒,你比15秒多一秒。产品宣传片由张艺谋执导,还叫《一秒钟》。

当然,在生数科技发布那篇介绍Vidu论文的2024年,这16秒是创造历史的。

毕竟彼时Sora还只是内测demo,即梦可灵也都不存在,市面上争夺国产视频模型第一番位的那些大学生项目,生成的视频不超过十秒。Vidu一说自己能连续生成16秒视频直接封神了。

但发布会只是发布会,论文只是论文,等生数正式推出支持生成16秒视频的Vidu Q3时,已经是2026年1月30日,没过几天伟大的Seedance 2.0就上线了,Vidu的16秒纯做给自己看的了。

AI时代的模型迭代得实在太他妈快了,卷得也太他妈激烈了。他昔日的那些国产对手转型的转型、退场的退场,留下的基本就是受大厂庇护的即梦、可灵,还有爱诗科技的PixVerse。

离字节快手的距离有点远了,所以生数只能和爱诗1v1,颅内复刻当年的激烈。

但这两家本身视频生成能力都属于第二梯队,所以也讲AI视频以外没法商业化的故事。

比如PixVerse做世界模型,Vidu就做具身大脑,两家你追我赶,都怕直接掉到第三梯队和套壳的那帮人坐一桌。

求求你们两家都分点精力在AI视频本身吧😭

不过没有关系,我认为出身清华的生数一定会逆势翻盘的。

话说回来,我认为生数在视频时长上确实是有执念的。

因为上文提到的ViduClaw的一个重要功能,就是全自动把数个短的视频拼到一起,拼成一个长的视频。理论上讲可以无限长。

为了展现这一点,我又打开ViduClaw,给了它一个任务:做一条结合胖猫和鹅腿阿姨的联动动画片。

剧情如上

我还贴心地上传了3张参考图,让他根据这几张图来生成视频。

我晚上七点多发出去的消息,它期间磨磨蹭蹭,九十点才把视频做好发我。

而且做出来的30秒视频长这样⬇️

在我已经上传了参考图的情况下,还能让每个画面里的胖猫画风都不一致,不知道的以为这是什么艺术上的考量。

这就是Vidu宣传的「主体一致」!效果非常的好!

Vidu的一切都很学生气,生成出来的视频也给人一种小组作业的感觉。

包括打开他们的公众号,推文内容风格也都跟那种大学官号一样。

但这是好事啊,恰恰说明他们有少年心气。

最近Vidu可能意识到自己视频质量跟不上了,开始走一个性价比的路线,主要面向B端客户的中年老板。

「价格砍20%!速度飙升20%!最具性价比的视频模型Vidu Q3来了!」

确实没撒谎。我粗略计算了一下,用即梦生成1条视频花的钱,可以用Vidu生成3条视频。

虽然能用的不多,但也很有优势。

不过现在Seedance mini也要上了,这要是直接打个三折,那Vidu不彻底没生态位了?

但没关系,我认为生数一定能逆风翻盘的。

一定要直接憋个大的,弄出来个真「为剧而生」的视频模型狠狠抽肿黑子们的脸。

最后附上道歉信🙇

经过深入了解和反思,我意识到生数是一家心胸宽广、虚心接受批评、也最不跟风龙虾的好公司,Vidu也是生成质量最好、人物生成主体一致、价格最低的视频生成模型,完全可以拳打可灵、脚踢Seedance 2.0。

作为全球首个实现数字世界与物理世界统一的通用世界模型的公司,(虽然不懂视频生成模型为啥能和物理世界统一,但生数这么说一定有它的道理),它必将带我们实现AGI。

我们将持续关注生数接下来发布的所有产品🫡

(本文封面由ChatGPT 生成,纯人工写作)

⬇️

欢迎订阅我们的Substack funeralai.substack.com