OpenAI o1
o1
OpenAI o1 是 OpenAI 于 2024 年 9 月发布的推理模型系列,也是其首个通过强化学习训练的成果。与 GPT-4o 不同,o1 在回答前会进行长链条的内部逻辑推理,在数学、物理、化学等复杂基准测试中表现达到博士生水平——国际数学奥林匹克资格考试中正确率 83%,远超 GPT-4o 的 13%。
o1 并非全能模型。它不具备网络浏览、文件上传、图像处理等 ChatGPT 的实用功能,世界事实知识表现也弱于 GPT-4o,且 API 价格更高。但在需要深度推理的专业场景,如科学研究、软件开发、复杂多步决策任务中,o1 的能力飞跃显著。OpenAI 将其命名为"o1"而非延续 GPT 编号,正是为了标志这一新范式的开端。
o1 的技术路线随后被验证具有持续扩展空间:2025 年 4 月发布的 o3 在编程、商业咨询等现实世界任务中比 o1 减少了 20% 的重大错误,o4-mini 则以更低成本在数学和视觉任务上接近完美表现。真格基金戴雨森将 o 系列的意义概括为"解锁 Agent 产品形态的关键"——模型思考能力足够强,才能自主使用工具、制定计划并检查执行。
由 AI 生成,可能出现错误,请仔细核对内容。
OpenAI o1产品
o1
渲染中…
在 6 篇文章中被提及
相关报道
Kimi 发布视觉思考模型 k1,「数理化」成绩领先 OpenAI o1|Z News
每个像素,都值得深入思考。
真格基金·三万字实录对话 Google Deepmind 研究员:拆解 OpenAI o1 及 LLM+RL 新范式|Z Talk
最硬核干货的 o1 技术解读。
真格基金·季逸超 Peak:迈向复现 OpenAI o1 的一小步之 Steiner 开源模型阶段性进展报告|Z Talk
从 OpenAI o1 发布以来,我就把复现 o1 作为业余时间的兴趣项目。
真格基金·Kimi 创始人杨植麟最新分享:关于 OpenAI o1 新范式的深度思考|Z Talk
大模型下半场,新范式开启?
真格基金·一文读懂,OpenAI全新大模型o1优劣何在? | 云启科技π
大模型天花板在哪里?
云启资本·




