产品

o1

OpenAI o1

OpenAI o1 是 OpenAI 于 2024 年 9 月发布的首个通过强化学习训练的推理模型系列,被团队视为继 GPT 系列之后的新范式起点。与追求快速响应的传统模型不同,o1 的核心设计是在给出答案前进行长链条的内部思考——用 OpenAI 联合创始人 Greg Brockman 的话说,GPT-4o 做的是"系统 I 思考",而 o1 通过思维链解锁了"系统 II 思考"。

在能力表现上,o1 的推理跃升相当显著:国际数学奥林匹克资格考试中正确率达到 83%,远超 GPT-4o 的 13%;Codeforces 编程竞赛中超过 89% 的人类参赛者;在 MMLU 测试的 57 个子类别中,54 个超越 GPT-4o。据云启资本的分析,这种突破源于 OpenAI 实现了"推理时计算扩展"——通过增加强化学习训练量和延长模型思考时间两条路径来提升性能,而非依赖传统预训练的数据堆叠。

但 o1 并非全能模型。它缺乏 ChatGPT 的网络浏览、文件上传和图像处理等实用功能,世界知识储备也不及 GPT-4o,API 价格则高出数倍。发布时 OpenAI 将其定为"预览版",同时推出了更小更便宜的 o1-mini。这一取舍在业界被解读为 OpenAI 模型迭代思路的转变:不求大求全,更贴近落地场景。

o1 的发布迅速拉高了行业追赶难度。真格基金组织的对话中,Google DeepMind 研究员评价其"真正提出并实现了 scaling up the inference time 的方案",但也指出模型隐藏的思考过程是否人类可读仍是未知数。此后 DeepSeek-R1 的开源复现与 Kimi k1 在数理化基准上的超越,标志着推理模型竞赛进入新阶段。

由 AI 生成,可能出现错误,请仔细核对内容。

o1产品
OpenAI o1
暂无关系图谱
在 6 篇文章中被提及

相关报道