产品

DeepSeek

DeepSeek-R1

DeepSeek 由幻方量化创始人梁文锋于 2023 年独立组建,初衷并非切入金融场景,而是直奔通用人工智能(AGI)。梁文锋在浙江大学攻读人工智能期间便笃信"人工智能一定会改变世界",毕业后未进大厂,而是辗转成都出租屋试错,最终切入金融并创立幻方;2021 年幻方即跻身千亿规模,被称为"量化四大天王"之一。

DeepSeek 的打法从一开始就带有浓厚的研究型色彩。梁文锋明确表示不做垂类应用,专注大模型本身,甚至坦承"如果一定要找一个商业上的理由,它可能是找不到的"。这种路径在 2025 年初迎来爆发:1 月发布的 DeepSeek-R1 以开源形式验证了强化学习(RL)在推理模型上的可行性,被真格基金戴雨森形容为提供了"一比特信息"——即告诉同行哪些路走不通、哪些值得深入。R1 的出圈还带来一个意外副产品:其文笔风格因未经过多中立性微调,反而呈现出独特的"天马行空"气质,甚至专门找了北大中文系人员做标注。

技术层面,DeepSeek 的迭代有其连续性。2024 年 5 月的 V2 引入了 DeepSeekMoE 和 MLA 架构,12 月的 V3 则加入 FP8 和 MTP 等训练与推理方法,所有这些都为 R1 的强化学习基础铺路。据真格基金的技术复盘,V3 的工程优化——从跨节点通信效率到汇编层面的改动——背后指向一个现实约束:"没卡"。资源受限反而成为创新的动力,这在戴雨森看来是 DeepSeek 与规模更大、资源更多的大厂仍能 PK 的关键。

DeepSeek 的出现对行业格局产生了"清场"效应。戴雨森在 2025 年 4 月的访谈中直言,R1 出圈前"六小虎"中已有几家放弃自研技术模型,R1 之后这一趋势更加明显;在他看来,Kimi 是当时唯一仍有能力持续参与 SOTA 模型竞争的选手。而 Alphaist 基金则将 DeepSeek 与大疆并置,认为二者代表了不同于互联网时代的科技型创业新范式:在强智力面前,普通用户数据反馈价值有限,真正应关注的是公司是否专注高效、能否率先突破技术临界点。

由 AI 生成,可能出现错误,请仔细核对内容。

DeepSeek产品
DeepSeek-R1
暂无关系图谱
在 66 篇文章中被提及

相关报道