产品

o1

OpenAI o1

OpenAI o1 是 OpenAI 于 2024 年 9 月发布的首个通过强化学习训练的推理模型系列，被团队视为继 GPT 系列之后的新范式起点。与追求快速响应的传统模型不同，o1 的核心设计是在给出答案前进行长链条的内部思考——用 OpenAI 联合创始人 Greg Brockman 的话说，GPT-4o 做的是"系统 I 思考"，而 o1 通过思维链解锁了"系统 II 思考"。

在能力表现上，o1 的推理跃升相当显著：国际数学奥林匹克资格考试中正确率达到 83%，远超 GPT-4o 的 13%；Codeforces 编程竞赛中超过 89% 的人类参赛者；在 MMLU 测试的 57 个子类别中，54 个超越 GPT-4o。据云启资本的分析，这种突破源于 OpenAI 实现了"推理时计算扩展"——通过增加强化学习训练量和延长模型思考时间两条路径来提升性能，而非依赖传统预训练的数据堆叠。

但 o1 并非全能模型。它缺乏 ChatGPT 的网络浏览、文件上传和图像处理等实用功能，世界知识储备也不及 GPT-4o，API 价格则高出数倍。发布时 OpenAI 将其定为"预览版"，同时推出了更小更便宜的 o1-mini。这一取舍在业界被解读为 OpenAI 模型迭代思路的转变：不求大求全，更贴近落地场景。

o1 的发布迅速拉高了行业追赶难度。真格基金组织的对话中，Google DeepMind 研究员评价其"真正提出并实现了 scaling up the inference time 的方案"，但也指出模型隐藏的思考过程是否人类可读仍是未知数。此后 DeepSeek-R1 的开源复现与 Kimi k1 在数理化基准上的超越，标志着推理模型竞赛进入新阶段。

由 AI 生成，可能出现错误，请仔细核对内容。

o1产品

OpenAI o1

暂无关系图谱

在 6 篇文章中被提及