产品

DeepSeek

DeepSeek-R1

DeepSeek 由幻方量化创始人梁文锋于 2023 年独立组建，初衷并非切入金融场景，而是直奔通用人工智能（AGI）。梁文锋在浙江大学攻读人工智能期间便笃信"人工智能一定会改变世界"，毕业后未进大厂，而是辗转成都出租屋试错，最终切入金融并创立幻方；2021 年幻方即跻身千亿规模，被称为"量化四大天王"之一。

DeepSeek 的打法从一开始就带有浓厚的研究型色彩。梁文锋明确表示不做垂类应用，专注大模型本身，甚至坦承"如果一定要找一个商业上的理由，它可能是找不到的"。这种路径在 2025 年初迎来爆发：1 月发布的 DeepSeek-R1 以开源形式验证了强化学习（RL）在推理模型上的可行性，被真格基金戴雨森形容为提供了"一比特信息"——即告诉同行哪些路走不通、哪些值得深入。R1 的出圈还带来一个意外副产品：其文笔风格因未经过多中立性微调，反而呈现出独特的"天马行空"气质，甚至专门找了北大中文系人员做标注。

技术层面，DeepSeek 的迭代有其连续性。2024 年 5 月的 V2 引入了 DeepSeekMoE 和 MLA 架构，12 月的 V3 则加入 FP8 和 MTP 等训练与推理方法，所有这些都为 R1 的强化学习基础铺路。据真格基金的技术复盘，V3 的工程优化——从跨节点通信效率到汇编层面的改动——背后指向一个现实约束："没卡"。资源受限反而成为创新的动力，这在戴雨森看来是 DeepSeek 与规模更大、资源更多的大厂仍能 PK 的关键。

DeepSeek 的出现对行业格局产生了"清场"效应。戴雨森在 2025 年 4 月的访谈中直言，R1 出圈前"六小虎"中已有几家放弃自研技术模型，R1 之后这一趋势更加明显；在他看来，Kimi 是当时唯一仍有能力持续参与 SOTA 模型竞争的选手。而 Alphaist 基金则将 DeepSeek 与大疆并置，认为二者代表了不同于互联网时代的科技型创业新范式：在强智力面前，普通用户数据反馈价值有限，真正应关注的是公司是否专注高效、能否率先突破技术临界点。

由 AI 生成，可能出现错误，请仔细核对内容。

DeepSeek产品

DeepSeek-R1

暂无关系图谱

在 66 篇文章中被提及