o1
OpenAI o1
OpenAI o1 是 OpenAI 于 2024 年 9 月发布的首个通过强化学习训练的推理模型系列,被团队视为继 GPT 系列之后的新范式起点。与追求快速响应的传统模型不同,o1 的核心设计是在给出答案前进行长链条的内部思考——用 OpenAI 联合创始人 Greg Brockman 的话说,GPT-4o 做的是"系统 I 思考",而 o1 通过思维链解锁了"系统 II 思考"。
在能力表现上,o1 的推理跃升相当显著:国际数学奥林匹克资格考试中正确率达到 83%,远超 GPT-4o 的 13%;Codeforces 编程竞赛中超过 89% 的人类参赛者;在 MMLU 测试的 57 个子类别中,54 个超越 GPT-4o。据云启资本的分析,这种突破源于 OpenAI 实现了"推理时计算扩展"——通过增加强化学习训练量和延长模型思考时间两条路径来提升性能,而非依赖传统预训练的数据堆叠。
但 o1 并非全能模型。它缺乏 ChatGPT 的网络浏览、文件上传和图像处理等实用功能,世界知识储备也不及 GPT-4o,API 价格则高出数倍。发布时 OpenAI 将其定为"预览版",同时推出了更小更便宜的 o1-mini。这一取舍在业界被解读为 OpenAI 模型迭代思路的转变:不求大求全,更贴近落地场景。
o1 的发布迅速拉高了行业追赶难度。真格基金组织的对话中,Google DeepMind 研究员评价其"真正提出并实现了 scaling up the inference time 的方案",但也指出模型隐藏的思考过程是否人类可读仍是未知数。此后 DeepSeek-R1 的开源复现与 Kimi k1 在数理化基准上的超越,标志着推理模型竞赛进入新阶段。
由 AI 生成,可能出现错误,请仔细核对内容。
相关报道
真格基金戴雨森:从「没必要付费」到「非用不可」,AI 正在冲击人类历史上最快的增长纪录
AI 的发展有点像烧开水,一旦到达沸点、蒸汽机的出现将会带来新的工业革命。
真格基金·真格基金戴雨森:长聊 AI Agent,各行业都会遭遇「李世石时刻」(上)
在 Agent 时代,「Attention is not all you need」。
真格基金·万字赏析 DeepSeek 创造之美:DeepSeek R1 是怎样炼成的?
今天 AI 的渗透率只有 5%。剩下 95% 的人,他们的第一款 AI 应用会是什么?
真格基金·与 Koji 的 2025 开年对谈:AI 关键之年,Agent 开启元年|此话当真 EP35
对 AI 保持乐观。
真格基金·微软 CEO Satya Nadella 近期访谈:从带领微软转型到对AI智能体未来的分析|Bolt荐阅
从“无所不知”转变为“无所不学”
线性资本·活动回顾|搜索、C.AI、硬件,AI落地摸爬滚打的一年
线性资本 v.s. 智谱 Z 计划文字总结
线性资本·





