云启研选 | AI行业年中观察:落地元年的十个美丽与哀愁

云启资本·2024年7月30日

成本与效果的天平如何摇摆?

性能超越GPT-3.5 Turbo,价格却是其60%。7月19日,OpenAI以这样一款主打高性价比的轻量级模型GPT-4o mini再次刷屏,也为AI应用落地又加了一分筹码。短短4天后,Meta又推出"巨无霸"级别开源模型Llama3.1,其在多项基准测试中击败闭源顶配GPT-4o。

这似乎是2024年AI发展轨迹的一个缩影:**开闭源模型差距缩小、模型成本超预期下降、应用开发门槛持续降低。**在AI继续牵引科技变革的2024,云启持续拥抱技术变化,在敏锐捕捉机遇的同时,也对瞬息万变的行业保持冷静观察和审慎判断。

AI一天,人间一年。本期「云启研选」和您分享,过去半年我们在瞬息万变的技术浪潮和行业格局中看到的趋势与方向。

一、年初核心判断回顾

在GPT引爆生成式AI的2023年,基础模型毫无疑问是资本布局重镇。Crunchbase数据显示,2023 年,全球人工智能初创公司融资额近500亿美元,其中180亿美元流向OpenAI、Anthropic 和 Inflection AI三家模型公司。而在中国, MiniMax等6家大模型初创公司也在资本多轮加注后纷纷跑出10亿美元以上估值。

AI应用层也有大量新公司涌入,且"上新"速度极快。A16Z 2023年9月发布的GenAI应用访问量TOP50中,有80%的上榜公司均为新公司。在4个月后的更新榜单中,新上榜的公司比例也高达40%。

我们认为,**基础模型能力是决定AI应用效果的核心基底。**通过持续的成本投入弥补基础模型缺陷,并在此基础上打磨更能满足不同场景或客户需求的应用效果,这是现阶段AI行业的一条演进主线。而要在行业发展早期突破重重不确定性存活下来,需要在成本和效果之间找到动态平衡。因此,成本降低和效果提升是我们关注的两大核心议题。

2024年伊始,我们对AI行业的生长轨迹做过如下判断。

基础模型能力持续进阶 单点技术突破带来成本下降和效果提升

基础能力竞赛持续白热化,海内外创业独角兽和科技大厂齐发,沿着Scaling Law路径打磨模型能力、降低模型成本。并行训练、推理优化、MoE等潜在技术突破将进一步带来降本效应;RAG、Planning、Memory、下一代架构等维度的突破将助力AI应用效果提升。

与此同时,视频生成模型、图像生成模型、多模态模型等对与应用层功能提升和产品创新强关联的基础模型能力也将不断进阶。

创投重心向应用层迁移 模型提效降本加速应用落地

资本持续重注下的海内外大模型格局已基本确定,相较应用开发需求,市场上大模型供给也相对充足。基于此,我们判断模型层创投增量机会有限,市场重心正向应用层迁移。

视频生成模型、图像生成模型、多模态模型等基础模型的能力优化催生应用层更多创新,加速应用落地。游戏、社交等娱乐场景的C端应用迎来功能增量和创新空间,尤其是底层技术突破带来的效果飞跃和成本下降或将驱动市场对此类应用的需求上升。

端侧模型部署等技术突破将拓宽消费电子的能力边界,AI能力有望为增长乏力的消费电子传统品类带来差异化突围窗口,也为更好满足新型需求的AI-Native新品类的诞生和爆发创造了土壤。

二、半年度重要趋势盘点

模型层:更强更便宜

1. 大模型降本进程超预期

"降价"是2024年大模型市场绕不开的关键词。我们曾在2024年初预测,根据AI行业成本的摩尔定律,未来3-5年大模型调用成本有望降至现在的1%,调用成本降低后,AI应用将迎来爆发拐点。

但基于模型推理成本下降和市场"价格战",大模型调用成本下降进程超出我们的预期。5月6日,幻方旗下大模型创业公司深度求索以每百万tokens输入1元人民币的开源模型DeepSeek-V2掀起降价潮,该模型的API价格约为ChatGPT4的1/100。此后半个月,智谱、字节、科大讯飞、阿里、百度、腾讯等纷纷跟进,其中字节降价力度达到97%,百度、腾讯、讯飞的部分轻量大模型甚至在限定条件下达到免费。

国外的典型案例则是OpenAI于7月下旬发布的GPT-4o mini,其性能超越GPT-3.5 Turbo,价格却是后者的60%。

降价潮叠加开闭源模型差距缩小,闭源大模型创业公司的商业模式面临挑战,在自研应用上做出差异化是破局关键

2. 视频生成模型跨入新代际

2024年,AI模型层的第一枚重磅炸弹依然来自本轮AI浪潮的引领者OpenAI。Sora的推出让大模型对语言的理解能力、多镜头生成的一致性、画质的清晰度、复杂场景的创建能力和对物理世界的模拟都达到「全新代际」。验证了**「GPT4→对多模态内容的简单分析→生成多模态内容」**这一步骤在文生视频产品中的有效性,同时再次"盖章"了基座模型GPT-4作为彼时最强大模型的降本增效实力。

时至7月,Sora商用仍未有新进展。但视频生成显然是近几个月来模型层发力的重点方向之一。据行业资讯媒体"智东西"不完全统计,Sora发布以来,Stability AI 、生数科技、字节跳动、快手、Luma AI、Runway等至少8家的国内企业推出了新产品或模型。其中快手可灵大模型是第一个高质量可公开使用的视频生成服务。其单次生成视频时长可达到120秒,另外还有一个特色功能续写能力。在此能力加持下,可支持用户生成约3分钟的视频。

除了生成时长,新一代产品在分辨率、帧率、动作一致性上都有大幅提升。

3. 开闭源模型差距持续缩小

大模型开闭源路线之争延续到2024年,闭源模型与开源模型的差距持续缩小,AI民主化趋势加强。

2月,谷歌发布开源系列模型Gemma;4月,Meta发布的开源大模型Llama3系列,"高配"的700亿参数版本能力对标GPT-3.5版本。7月,Meta、Mistral又在连续两天分别推出Llama3.1 和Mistral Large2,其中前者在通用能力、代码能力、数学能力、推理能力、工具调用能力、长文本能力、多语言能力的榜单测评中全面领先GPT-4,部分能力与GPT-4o各有胜负。国内方面,5月份,阿里云开源的1100亿参数模型Qwen1.5-110B性能登顶国内开源模型。

4. 端到端多模态成核心竞争力

大模型对多模态(文本、语音、视觉)的理解和生成能力是优化AI应用能力、提升用户体验的关键。AI主流玩家新品发布最密集的5月,OpenAI推出主打端到端多模态的GPT-4o,以实时带感情的语音交互和实时视频交互等多模态生成效果引领模型层迭代方向。

上述能力的实现基于GPT-4o在模型层面的算法大一统,即把此前多个独立的多模态大模型集成为一体。例如在语音识别过程中,过去的ASR(自动语音识别)、TTS(文本到语音)等拆解步骤被合而为一了,这使得多模态内容的理解生成更快、更高效。而伴随端到端多模态的能力优化,应用层创新也迎来更大的想象空间。

5. 头部模型能力迭代速度放缓

尽管2024年的模型层仍在朝更加强大的性能迈进,但GPT4发布一年多后,头部模型能力的进阶速度显著放缓。以GPT-4o为例,尽管它被视作2024年以来闭源大模型中最重要的一次更新,但除音频、视频和图像能力之外,其他性能提升效果有限。在传统基准测试下的文本、推理和代码智能方面与2023年11月发布的GPT-4 Turbo持平。

不过从应用效果来看,模型能力的细微差别仍会带给用户迥然不同的体验。例如GPT-4在很多测试指标上正确率只有60%、70%,因此大模型产品大多只能以诸如对话的容错率较高的产品形式存在。有鉴于此,基础能力的打磨和突破模型层仍是当下的重点。

应用层:等待爆发时刻

1. 模型能力进阶催化应用层供给

2022年至今,工程门槛显著降低让AI应用功能开发难度降低、速度加快。与此同时,视频生成模型、图像生成模型、多模态模型的能力优化促使应用层涌入更多玩家,且行业格局快速洗牌。2024年3月,a16z更新的GenAI 应用(Web端)TOP50 中,有40%的上榜应用为新公司。

我们持续关注Consumer(代表赛道:游戏、虚拟陪伴、内容社区、消费电子、搜索)、Pro User(代表赛道:视频编辑、知识管理、音乐编辑、学习工具、浏览器sidebar)、Enterprise(代表赛道:各类toB软件+AI)等领域的应用机会。

2. 但应用层商业化进展依然缓慢

从海外市场来看,2B场景因为模型幻觉/不可控问题,需要和业务流深度结合。加上当前经济周期下B端用户预算缩减,toB类AI应用难以靠AI形成收入,整体落地情况不及预期。2C/Prosumer工具端应用则相对好落地。特别对中国出海公司而言,借助AI在游戏、情感陪伴等非严肃场景下带来的功能增量,已有部分找到PMF。但整体留存率不及上一波互联网产品。

国内来看,B端,"传统应用+AI"的商业化进展快于AI-Native应用,客服、营销、家装设计领域的toB应用正通过叠加AI能力为客户提供更为优质的服务。C端应用中迟迟未有爆款产品,ChatBot、文本工具、作画、代码开发等类型,整体差异化偏低,且AI软件应用在核心终端设备的整体渗透率在不足1%的低水位徘徊。

3. 瓶颈:更难的PMF、待提升的模型能力

相对缓慢的商业化进展也折射出AI应用的PMF难度。相较于移动互联网,AI 时代下技术和产品的边界更加模糊。因为模型能力显著决定产品功能,也就是说模型能力每向前一步,产品功能模块就有迭代的可能 。这意味着,产品经理既要清晰把握技术边界,也要精准洞察用户需求。

而回到模型与应用的关系,当前的模型能力仍不足以在应用层带来成本和效果的双赢体验,基础模型缺陷仍需弥补。

4. 成熟硬件品类竞逐AI,AI-Native硬件起步艰难

ChatGPT快速出圈带来一波AI硬件热潮,诞生了AI Pin、Tab AI、Rabbit R1等一系列AI Native硬件。这些产品在形态上有所创新,并以"取代手机"为定位进行营销,在短期内获得大量关注,但大多没能继续留在牌桌上。究其原因,核心在于**AI给硬件功能本身没有带来实质性的提升,**不足以催生新的用户需求。

"硬件+AI"方面,行业头部玩家在PC、手机等通用硬件品类上都有置入AI的动作,或披露了相应计划。例如微软5月份发布了一系列本地大模型,并优化了微软Copilot的功能;华为、三星、Vivo等也均推出打造云端或端侧大模型的手机产品,苹果的AI手机也在6月份公开的Apple Intelligence 初见端倪,内容跨App交互、开放API等均是值得期待的亮点 。除此,录音笔、耳机、眼镜等成熟硬件品类下,也有部分成熟玩家也在AI功能加持下摸索出破解增长瓶颈的差异化路线。

我们看好AI能力泛化性给成熟品类带来的差异化突围窗口,也期待在小众的利基市场中,AI能力进阶给AI-native硬件带来的新机会。

5. 具身智能研发、融资活跃

2024年,作为AI能力落地物理世界最佳载体的具身智能依然是热门赛道,各类玩家朝着最符合人类对人工智能终极形态想象的通用机器人迈进。

走在行业前端的软硬件一体玩家Tesla发布Optimus Gen2,相较初代在行走速度、未来想象的AI机器人快速生长。国内AI机器人初创企业也在产品开发和融资上动态频频。例如云启天使轮被投「星尘智能」于4月份发布首款自研AI机器人Astribot S1 Demo,在同规格机器人中具备"最强操作性能"。

我们认为,大模型是具身智能泛化性优势能否真正释放的关键,关乎机器人感知、决策和行动能力能否取得阶跃式突破。目前具身智能的基础模型方案尚未收敛,模型层面的针对性突破值得期待。

三、结语

时至2024年下半场,落地应用俨然是AI行业的核心主题。我们在继续关注模型层和infra层的同时,也重点关注AI在以下几个领域的应用:

·AI+Enterprise Software。 企业级软件在AI加持下可以有更多的功能创新,利于提升客单价,降低成本与费用。还能通过AI Agent完成复杂或重复性任务,为企业提供数字劳动力。

**·AI+Professional Service。**AI会使传统业务公司的Unit economics发生显著变化,解决效率和成本瓶颈,扩展服务边界。

·Productivity tools。 大模型颠覆了传统搜索引擎和信息获取方式,生成式AI也为效率提升带来显著增益。同时,AI助力实现的任务自动化对有望进一步将人力从重复性工作中解放,释放更多创造性价值。

·AI for science。 看好大模型在科学发现、新药研究、新材料发现、数学定理辅助证明等场景下的应用,期待AI在研究提效、拓宽科学边界中发挥更深远的价值。

·具身智能。 通用性和泛化性技术优势将把机器人自动化时代带入智能化时代,当前具身智能技术路线尚未收敛,具身智能形态尚处于雏形阶段,我们乐见并支持创新企业在不同路径下的探索。

**·消费电子。**AI能力带来的产品功能优势,叠加中国制造业沉淀的供应链红利,为AI+消费电子带来可观的价值空间。

·泛娱乐。AI在游戏可玩性提升、情绪价值创造等维度的增量价值,叠加端到端多模态的给娱乐类应用带来巨大的创新空间。

*部分内容由AI基于云启内部研究生成