DeepSeek蝴蝶效应:如何重塑AI生态? | 云启科技手账
高性能、低成本的"AI界拼多多"DeepSeek,给整个AI生态带来了什么?

高性能、低成本的"AI界拼多多"DeepSeek,给整个AI生态带来了什么?
开工伊始,云启投资团队围绕相关问题展开讨论;云启被投亦积极接入DeepSeek,第一时间探索实践高效推理模型给内部提效、产品迭代上的新可能。本期「云启科技手账」和你分享云启团队的部分思考和云启被投相关动态。
➤➤云启观察:DeepSeek的创新启示
如何看待DeepSeek的突破性创新?
DeepSeek的创新并不等价于发明了如同transformer量级的新架构,而在于开源了一个SOTA模型,并将成本砍到地板价,同时在post-traning阶段第一个找到强化学习的路径。其创新之处在于通过低精度数据推理格式、GPU编译器层面的底层编写等工程优化手段把价格降到很低,并且沿着这个路径在中国组织起高密度的人才团队做相关探索。
对于整个行业的技术探索来说,DeepSeek跑通强化学习路径后也让业界对他们的方法论有了更多信心。高效的模型架构、高效的强化学习、高效的算力利用或将成更加主流的突破方向。
如何看待DeepSeek的关键行业影响?
用更低的的训练成本和计算成本可以达到同等的模型能力成为了新共识,也让市场对模型成本下降和模型能力的提高更有信心,进而对应用端有巨大影响。
对于AI大模型公司来说,推理、多模态、对齐、self-aware是重要的模型提升方向。追赶SOTA水平,保持不掉队,是2025的关键。
受益于模型性能提升、算力成本下降、流量红利等多重利好,应用端有望迎来全面爆发,期待agent应用的更多创新落地。
➤➤云启伙伴:如何拥抱DeepSeek?






