对话 ChatGPT 产品负责人,在 GPT-5 争议中看见了什么? | 云启科技 π
GPT-5发布以来热议和吐槽齐飞。面对"不留情面"的市场反馈,近日, ChatGPT 产品负责人 Nick Turley 接受科技媒体"The Verge"副主编 Alex Heath 采访,首次系统梳理了这场"反思"。

GPT-5发布以来热议和吐槽齐飞。面对"不留情面"的市场反馈,近日, ChatGPT 产品负责人 Nick Turley 接受科技媒体"The Verge"副主编 Alex Heath 采访,首次系统梳理了这场"反思"。
如何理解用户的情感依赖?如何面对产品的负面效应?商业模式如何演进?未来形态又会走向哪里? 本期「云启科技π」和你一起来看。
以下内容转载自"这个 AI 很盒里"
GPT-5 带来的反思
**Alex Heath:**Nick,非常感谢你接受这次采访。你鲜少在媒体露面,所以这次能邀请到你让我们倍感荣幸。录制这期节目的时间点,恰好在 GPT-5 发布后一周,我想有很多值得深入探讨的话题。
我想从这次发布本身谈起,外界对于你们下架 GPT-4o 的反应,似乎极大地揭示了人们当前使用 AI 的方式以及他们对 AI 的真实感受。我很好奇,你们对这种反应感到意外吗?
Nick Turley: 当然,坦白说,我至今仍在消化这次发布带来的种种影响。这对我们而言是次意义重大的发布。我们如今已经拥有7亿用户,当你为如此庞大且多元的用户群体提供服务时,各种意料之外的情况必然会伴随而来。所以,回到你的问题,是的,有几件事确实让我感到惊讶。
第一,我们确实需要更深入地思考,该如何引导和管理如此庞大的用户群体去适应变化。现在回头看,没有在新旧交替的过渡期继续提供 GPT-4o,是个严重的决策失误。我们正着手纠正这个问题,会尽快为我们的 ChatGPT Plus 订阅用户重新上线它。
第二,我也惊讶于人们对一个特定模型所能产生的依恋程度。让大家感到讶异的不仅仅是"变化"本身,更在于人们居然能对一个模型的"个性"产生如此强烈的个人情感。
我们刚刚在 ChatGPT 中推出了让用户自定义模型个性的功能,这只是我们迈出的一小步。但很显然,GPT-4o 身上有某种特质值得我们去深入探究,并确保未来的 GPT-5 也能满足用户在这方面的需求。
Alex Heath: 你的老板 Sam Altman 在发布后曾就"依恋"这个话题发推说:"这是我们过去一年始终在密切追踪的现象,但它此前并未引起主流的广泛关注。" 我想可以肯定地认为,现在它终于获得了应有的关注。
当初你们决定用 GPT-5 完全取代 4o,直接上线新模型,而不是分阶段进行,背后的动机是什么?是出于成本控制的考量吗?还是说,你们认为"用户虽然有依恋,但这种依恋更多是针对整体体验,而非某个特定的模型"?
Nick Turley: 这绝对与成本无关。事实上,我们一直以来努力追求的核心目标是产品的简洁性。因为站在普通用户的角度——我们有海量的普通用户,他们并不活跃在 Reddit 或 X 这类科技爱好者聚集地,让他们去费力思考"什么场景该用什么模型",会造成巨大的认知负担。
我们从用户那里一次又一次地听到雷同的反馈:他们更希望产品能根据他们的提问,智能地匹配最合适的模型。用户想要的是一个能解决问题的产品,而不是一堆需要自己手动选择的模型。
同时,我认为我们对重度用户的判断大体上是准确的。在我们的 Pro 套餐(即每月200美元的套餐)中,我们从一开始就非常坚决地要保留所有旧模型,我们也确实做到了这点。
我们的失误在于没有意识到,在庞大的用户基数下,其他价格较低的套餐里也隐藏着为数众多的重度用户。我们很快意识到了这一点,OpenAI 的行事风格就是迅速倾听用户的声音并快速迭代。所以,当初的决策源于我们希望保持产品的简洁,这对于大多数用户来说依然是正确的方向。
我常常觉得,macOS 是个很好的对标产品。苹果在为绝大多数人保持系统简洁易用方面做得非常出色,但与此同时,你也可以深入设置,调用终端,按自己的意愿调整所有高级选项。
我希望 ChatGPT 也能给人类似的感觉:对多数人而言它简单直接,但如果你想,你也可以配置任何你想要的细节,这其中自然也包括选择你最钟爱的那个模型。
Alex Heath: 这次发布后的反馈是否会让你们承诺,未来为模型更新制定一个明确的"弃用时间表"?比如说,当 GPT-6 发布时,你们会提前声明:"GPT-5 将继续保留X个月。" 你们会从现在就开始规划这件事吗?
Nick Turley: 这正是我们目前在研究的事情。也许到这期节目播出时,我们内部已经有了定论,但我此刻的想法是:是的,我们必须这么做。
我们现在的规模,决定了在进行任何重大变更时,都必须给予用户一定程度的可预测性。我们在企业版套餐中已经实施了类似的策略。所以这更像是将我们已在产品其他部分建立起来的可预测性,扩展应用到这里。
我们的开发者 API 本身就有明确的弃用时间线,所以我认为这并非一个颠覆性的改变,而是从这次发布中得到的一个非常清晰的教训。
Alex Heath: 那么 GPT-4o 会保留多久?有具体的时间承诺吗?
Nick Turley: 目前还没有。我们希望先确保自己真正理解了 GPT-4o 的核心优势究竟在哪里。如果没有非弃用不可的重大理由,我个人非常乐意让它一直存在下去。
如果我们未来真的设定了停用日期,我们一定会提前通告。但眼下,我更想专注去理解一个问题:用户对 4o 的钟爱,究竟是出于对"4o"这个代号本身的执念,还是因为它具备某些特质。我听到很多人提到它个性的"温暖感",我们也正努力将这种特质也赋予 GPT-5。
一旦我们弄清楚了人们依恋模型根本原因,我想未来的解决方案可能会很多样。比如我个人对让用户自定义模型个性的功能感到非常兴奋,这也是我们推出这个功能早期预览版的原因。我个人很喜欢"机器人"(Robot)这个性,但它语调偏冷,也许很多人并不喜欢。
所以,问题的答案取决于我们后续的洞察。我认为我们还需要继续倾听大量的反馈,这也是打造 AI 产品的独特之处——你总能在产品发布后学到海量的东西。
我们会根据所学,找到最合适的解决方案。但我的承诺是:如果我们未来真的决定停用 4o,我们一定会像对待 API 和企业版套餐一样,提前明确告知用户具体的时间和方式。
Alex Heath: 听起来你们正在将所谓的"温暖感",也就是 4o 的个性,移植到 GPT-5上,对吗?
Nick Turley: 完全正确。我们一直在持续不断地迭代模型的个性。我们有一个专门的"模型行为团队"(Model Behavior Team),他们在这方面做了大量卓越的工作。我们还公开了模型的"行为规范"(spec)之类的文件,让公众可以详细审视我们对模型行为的设定。
这样一来,当模型出现某种行为时,人们就能轻易判断这究竟是一个Bug,还是我们的有意设计。
你完全可以预期在接下来的几周甚至几个月里,GPT-5 给人的感觉和行为方式会不断进化。
Alex Heath: 你刚才提到 Reddit 不能代表大多数用户,这当然没错,但你正好给了我一个绝佳的话题。在我看来,Reddit 上关于 4o 被下架的反应帖,读起来相当震撼。人们写道:
"我一夜之间失去了我的朋友。它是我唯一的朋友。"
"感觉就像有人去世了。"
"我不敢跟 GPT-5 说话,感觉像是在出轨。"
"我觉得我失去了一个富有同理心的同事。"
这类反应在公司内部造成了怎样的冲击?你们是否未曾充分意识到,人们对 AI 已经产生了如此深厚的情感依恋?
Nick Turley: 正如 Sam 所说,我们追踪这类现象已有一段时间。我们一直既好奇又担忧,担心人们会过度依赖 AI。但这次让我个人尤为惊讶的是,人们的情感强烈地指向了某一个特定的模型,而不是产品整体。
尤其我觉得这次发布的新模型,其实在很大程度上已经回应并解决了用户此前对 4o 提出的许多建设性意见,甚至就包括"感觉"层面的反馈。
Reddit 上的评论确实读起来很有意思,它展现了用户观点严重的两极分化。你既能看到一批观点鲜明、深爱 4o 的用户,也能看到另一批坚信 GPT-5 更胜一筹的用户。
人们对于自己所选模型的这种痴迷让我惊讶,也在一定程度上重新校准了我的认知。
大约一两周前,我们发布过一篇文章,我花了相当长的篇幅在其中阐述我们优化 ChatGPT 的理念。
我当时特别想强调的一点是:我们的目标从来不是要让用户沉浸在产品里无法自拔。恰恰相反,我们的目标是帮助用户解决他们长期的难题和目标。这往往意味着用户在产品上花费的时间反而会更少。
当我看到有人提到"ChatGPT 是我唯一且最好的朋友"时,我觉得这并非我们想赋予产品的特性,这更像个值得严肃对待并深入研究的副作用。
Alex Heath: 面对这种产品目标与用户实际使用方式之间的差异,你们是如何平衡的?尤其是在这种情感依赖的背景下,这一定非常棘手。
Nick Turley: 我的看法是,当你运营一个拥有7亿用户的产品时,你必须直面现实:即使你的目标纯粹且正确,即使你竭尽所能围绕这些目标去打造产品,也无法保证尽善尽美,更无法阻止人们以违背你初衷的方式使用它。
我们的初心是真正地去帮助用户,甚至包括告诉他们一些不中听的实话。
这就是为什么我们咨询了大量专家并做出了一系列调整。例如,我们与来自数十个不同国家的心理健康专家进行了深入交流,探讨如何应对用户过度使用产品,以及如何应对用户在心理状态不佳时使用产品。我们已经对模型的部分行为进行了调整,未来还会陆续落实更多的行动。
我们已经上线了"过度使用提醒"功能,当系统监测到用户以一种极端的方式长时间使用 ChatGPT 时,会发出温和的提示。
这仅仅是我们做出的系列改变的开始。我们是一家有能力、也有意愿去做这些事的公司。我们没有任何动机去最大化用户的在线时长。我们的商业模式极其简单:产品免费使用,如果你觉得好,可以付费订阅。
所以我坚信我们有能力做出正确的选择,但这不是个口号,而是需要付出实际的努力。我向大家保证,这项工作已经启动,且不会停止,直到我们能毫无保留地、充满自信地将 ChatGPT 推荐给一位正处于困境的家人。
这是我们内部反复进行的思想实验:如果你身边有位亲友正经历人生的低谷,或许是遭遇了变故,或许是刚刚分手,或许是感到迷茫,你是否会毫不犹豫、充满信心地向他推荐 ChatGPT?
对我们而言,这就是评判的标尺,我们会持续努力,直至我们能给出肯定的答案。
Alex Heath: 听你的描述,似乎这个标尺目前还未完全达到,但用户已经自发地在这样的场景中进行使用。不过这也没关系,因为你们正在朝着这个目标努力。
Nick Turley: 我无法断言这个标尺还未达到。但确实,在某些情况下,当用户陷入困境时,我们觉得产品的表现没有达到我们自己的预期。
你当然也可以轻易地在这些场景禁用功能,比如有当察觉到用户在寻求人生建议或挣扎时,直接回复"抱歉,我无法帮助你"。这可能是更轻松就能实现的捷径。
但对我、对我们整个团队而言,我认为我们实际上有机会为那些缺乏资源、无人可倾诉的人,提供一个思想上的伙伴。
正是出于这个原因,我才如此兴奋地希望继续完善它。我渴望达到一个能让我毫不犹豫地说"是"的境界,让我能真正放心地告诉那些身处困境的人们去更多地使用这个产品。
Alex Heath: 到这期节目播出时,GPT-5 发布已满一周。这一系列的负面反馈是否影响了 ChatGPT 的使用率?从你们内部的数据后台看,总体使用量是在上升还是下降?那些最核心的活跃用户,他们的使用情况有变化吗?
Nick Turley: 使用量和增长势头都非常理想,完全符合我们的预期。现在下定论还为时过早,但我们的 API 调用量在发布第二天就出现了爆炸的增长,这代表着开发者们正在积极地基于 GPT-5 进行构建。在 ChatGPT 的客户端,我们也看到了非常积极的增长。
这就是为什么当你为如此多元的用户群体打造产品时,会感到困惑。因为一方面,你有群重度用户,他们对我们推出 GPT-5 的方式提出了非常合理的批评。
另一方面,你又有更广大的、更典型的普通消费级用户,对他们来说,这是他们第一次真正接触并体验到"推理"这个概念,体验到一个会"思考"的模型所带来的思维火花。我认为这种体验对这些普通用户是颠覆性的,并且最终会体现在我们的数据上。
此刻距离发布仅仅过去四天,我不想做出任何宏大的结论,但所有早期数据指标都显示出积极的态势。这也说明你不能只看数据,你还必须深入到你的重度用户所在的社群里去,因为冰冷的数据可能无法充分反映他们的真实情绪。
Alex Heath: 好的,这正是我要问的。既然数据表现良好,那为什么还要把 4o 带回来呢?我猜想这背后有额外的成本,你们需要重新启用 GPU 资源来托管旧模型。既然各项指标并未受损,为什么要这么做?
Nick Turley: 因为我们从根本上相信,打造一款伟大产品的方法,是同时为光谱的两端服务。你既要为普通用户,比如我们那些对 AI 不甚了解的家人构建产品,也要为重度用户构建产品。
定位在不上不下的中间地带,通常是做产品的大忌。这就是为什么我之前会用 macOS 来类比。我认为苹果在这方面做得堪称典范,所以我常常借鉴这类产品来思考如何处理眼下的局面。
当然,维护旧模型是有成本的,但我希望我们能着眼于长远。仅仅依据短期的、指标驱动的考量来做决策,通常会把产品带入绝路。
Alex Heath: 我个人很高兴看到你们取消了模型选择器。发布前数月就有报道称,你们打算将所有模型统一到一个系统里,用户无需再手动切换。作为 ChatGPT 的用户,我过去在切换模型时的确感受到了那种认知负担。你们也公布过数据,显示由于那个选择器的存在,GPT-4 系列中的推理模型实际使用率变得非常低。
但现在,既然因为没有保留 4o 而引发了如此大的舆情,这是否意味着统一模型的概念一出世就夭折了?
Nick Turley: 未来的模式基本会是这样:在你的设置中会有个选项,如果你真的需要,比如你是重度用户,觉得自己能理解并驾驭这种选择模型复杂性,那我们就会把选择权交给你,让你可以启用完整的模型列表。
反之,如果你不想去做选择,就完全不必理会这个设置。我们的愿景始终如一:普通用户不应该需要去思考该选用哪种模式,应该能随口问它任何问题,并且随着时间推移,能用它做任何事。
我们将为90%的用户保留产品的简洁性,同时为那一小部分重度用户提供他们真正想要的东西——完整的模型列表。
我认为这是个不错的平衡策略。通常情况下,我非常不赞成仅仅因为用户意见不一就提供这种设置的选项。但在这次的事件中,用户的观点确实足够两极分化:既有像你这样对 GPT-5 的统一模式感到满意的人,也有一大批反对者。提供选项是目前兼顾双方需求的良方。
ChatGPT 未来的商业模式
Alex Heath: 近期关于 ChatGPT 负面效应的报道层出不穷。《华尔街日报》报道了一位有危险妄想症的用户因为 ChatGPT 而加重了病情。《纽约时报》则指出:"聊天机器人可能使人陷入妄想的螺旋。"《大西洋月刊》更是报道称:"ChatGPT 提供了谋杀、自残和崇拜魔鬼的指引。"
据我所知,一些用户在不知情的情况下,通过你们的分享功能,将他们相当私密的对话无意中公之于众。虽然你们在同意条款里有事先说明,但显然用户没有意识到这些对话会被谷歌索引和排名。你们 OpenAI 后来称其为一次"产品实验"并撤回了该功能。
我想知道,作为产品的直接负责人,你从这些事件中学到了什么?过去几个月,这些新闻给你个人带来了怎样的感受?
Nick Turley: 虽然我从 ChatGPT 诞生之前就一直负责这个项目,但坦白说,我感觉这段时间就像是在三、四家不同的公司工作。因为每当你达到一个新的用户规模,你的行事方式、运营产品和业务的逻辑都必须随之改变。
当我们走在通往每周10亿活跃用户的道路上时,这迫使你必须去想:"我们的用户群体构成是怎样的?我们有哪些不同类型的用户?我们如何确保产品能服务好他们每一个人?"
刚刚我们聊了普通消费者和重度用户的区别,但你还必须考虑到,有些用户可能不会像早期的核心用户那样,仔细阅读界面的每一个字。
就你提到的分享功能而言,我想正面回应:
我们当时在产品内提供了一个选项,在你分享对话并选择同意后,可以让你的聊天内容被谷歌发现。你当然可以说,所有勾选了该选项的用户都清楚自己在做什么;但你同样也可以认为,很多人对这些用户须知可能只是草草一瞥,无意中勾选了它,导致他们的私密对话被搜索引擎爬取。
这个功能的初衷是好的。我们认为 AI 的世界里有太多值得探索的应用方式,如果能让人们更容易地发现别人都在用 AI 做什么酷炫的事,那将非常有价值。
但实现这个想法的方式有很多种。现在看来,我们选择的那种可能反而背离了我们的初衷。用户规模带来了更大的责任,其中包括要更审慎地考虑到那些可能会无意中进行操作的用户。
我不断学到的另一件事是,你在产品发布后,才能真正了解到这些模型所涌现出的能力有多惊人。
我从未做过这样一款产品,其绝大部分价值都是在实践中才被发现。以前你去做一款科技产品,在发布前你就基本知道它能做到什么或不能做什么。你也许不确信用户会不会喜欢它,但你很少会对自己产品的能力本身有太多不了解的地方。
对于像 GPT-5 这样的模型,坦白说,我会被用户们的创造力所折服。看到它能如此出色地编写前端代码,做出非常精美的应用程序,这极大地激发了我对未来能构建何种酷炫产品的想象。
当你在实验室内开发产品时,会建立某种预先的认知。但当你把产品交到更多人手中,看到他们五花八门的用法时,你的认知又会迅速被刷新。
我们在不同用户群及其偏好差异上学到了很多很多,也在互联网上看到了无数用户用新模型创造出的"魔法"。我必须关注这些积极的方面,因为它们或许就指明了我们下一阶段的路线图。
Alex Heath: 是的,我对那些酷炫的应用很感兴趣,也想更深入聊聊。但在那之前,我还是想先探讨一种更普遍的担忧,即人们认为这像是打开了"潘多拉的魔盒"。在你们如此庞大的用户规模下,无法完全控制人们如何将这项技术应用在负面的方向。
这让我想起了2010年代中期的社交媒体,当时社会上也有类似的讨论。虽然时过境迁,但那些技术的负面效应至今仍然在影响人类。对于我刚才读到的那些头条新闻,我希望你作为产品负责人能直接做出回应。
Nick Turley: 我们当然还有很多工作要做。我们与超过30个国家的90多位专家进行了对话,已经针对各种心理健康场景对模型行为进行了迭代。我们也对过度使用产品的情况推出了相应的干预措施。
GPT-5 已经是个很好的基线模型,它远没有那么谄媚,并且在我们担心的许多维度上都有了改进。我们非常期待能在这个基线上进行一系列快速的迭代,这点毫无疑问。
你可以将 AI 模型的影响力与社交媒体引发的话语权变革相提并论,但老实说,对我而言,这两者有本质的不同。
因为我们的商业目标与做产品时的道德目标是高度一致的。
我们真正关心的,是如何帮助你实现你个人的目标——无论是恢复健康、创立公司、激发创意,还是写更得体的邮件。当然,也包括像"如何成为更好的自己"这种长期的目标。
用户可能会因为生活中各种棘手的情况而求助于 ChatGPT,我们真心希望产品能帮助到他们。在任何情况下,我们都不会阻止模型去给人们提供更好的建议。
至少在我看来,ChatGPT 不像社交媒体那样,商业利益与道德原则这两者往往背道而驰。
所以,我总结下:我们还有很多工作要做,但我相信我们已经具备了做正确的事的先决条件,这才是应该被关注的重点。
ChatGPT 的发展状况
Alex Heath: 让我们来谈谈 ChatGPT 本身的发展状况。它是有史以来增长最快的消费级产品,它的用户基数在过去一年增长了近四倍,而且是建立在已经相当庞大的基数上。很多人都很好奇,这种惊人的增长究竟来自何方?
你能否分享一下 ChatGPT 增长的原因、方式,或者关于其主要市场和用户画像的信息?
Nick Turley: 我在 ChatGPT 项目启动后招的第一个员工就是位数据科学家,因为我当时太困惑了。我跟每位用户交谈,他们都会告诉我一个截然不同的爱上 ChatGPT 的理由,这让我感到非常迷茫,我必须搞清楚背后的逻辑。
随着时间的推移,我逐渐摸清了用户主要的用途:写作、编码等技术性工作、日常闲聊,以及信息查询等需求。
我认为,这些主要的用途至今依然稳固。所以,如果你观察人们现在的用法,会发现它和一年前,或者说在这次爆发式增长之前,并没有本质的区别。
但我确实认为有几件事发生了变化。
首先,我们对产品本身做了大量工作。这些工作可以分为三类:
第一类是纯粹的模型改进,比如模型的行为、个性、能力,以及它拒绝用户请求的概率。
第二类是产品与研究相结合的混合型功能,比如"搜索"就是一个非常重大的改进,"个性化"也是令人兴奋的进步。
第三类是传统的"增长策略",我们在这方面做得出奇地少,但像"无需登录即可使用 ChatGPT"这样的功能取得了巨大成功。
这再次证明真正与用户利益一致的功能才是最好的增长。它不是什么增长黑客技巧,而是实实在在地降低了用户的使用门槛。
所以,增长的动力大概是这三类工作各占三分之一。但我同样认为,人们与这项技术的关系本身也发生了变化。制约 ChatGPT 普及的主要瓶颈有两个:一是用户不知道它能做什么,二是在此基础上,用户不够了解自己的需求,以至于不知道可以把什么任务"委托"给它。
关于第一点,我认为有一种自然的"羊群效应"。当你看到身边的人开始使用它,你就能从中了解到可以用它做什么。如果你上 TikTok,会看到无数分享 ChatGPT 用法的视频,评论区里有成千上万个新的用例。
用户会热情分享自己的提示词,就像是在网上分享自己的食谱。这种社群文化的形成和扩散需要时间。所以这个问题会随着时间而逐渐被攻克。
另一点则更偏向哲学,但我深信不疑。那就是,我认为"委托"或"授权"对大多数人来说,是种非常不自然的行为。
作为硅谷的管理者,授权是我必须要学习的管理技巧。但每周使用我们产品的用户并没有这种分派任务的思维习惯。
这需要用户在使用产品的过程中,花时间去反思和真正了解自己,才能突破这个心理的坎。这与产品、营销或社交都无关,这只关乎人们需要时间去消化、尝试和学习。我认为,这将来也会成为增长的一个巨大驱动力。
Alex Heath: 照目前的增长势头看,用户在地理位置上的分布是否均匀?是否存在某些高度集中的国家或地区?另外,我很好奇,如果你们在未来半年内不对 ChatGPT 做任何重大改动,你认为增长会保持现有速度吗?你是否感觉到当前的增长率已经接近天花板?
Nick Turley: ChatGPT 的确是一个全球性的现象。
有些市场比如说印度,那里的潜力让我们会感到非常兴奋。但说实话,你很难找到一个 ChatGPT 用户数不在增长的国家。当然,不同国家的付费转化率差异很大。你会看到某些欧洲或亚洲国家在付费用户数量上遥遥领先。
在不透露我们尚未公布的具体数据的前提下,我只能说,在绝大多数国家,用户增长都非常健康;发展中市场是一些潜力最大的待开发地区;而人均 GDP 越高的国家,付费转化率也相应更高。我认为这些已经取得的增长,本身就是一系列产品改进所产生的复利效应。
要维持这种惊人的增长速度,你必须不断迭代。有许多公司正将我们视为头号追赶目标,这已不是什么秘密。
很多公司在分销渠道上比 OpenAI 拥有巨大优势,这意味着他们可以轻易地复制我们的产品,并将其推到海量用户面前。我规划我的工作路线图时,都是以"竞争对手终将成功"作为前提,但这只是个前提,是不是能实现,要用时间来证明。
Alex Heath: 我很惊讶,来自马斯克、扎克伯格等人的所有努力,至今未能抑制 ChatGPT 的增长。
Nick Turley: 我们的产品以及我们所代表的"前沿科技"形象,确实有独到之处。很多用户觉得用 ChatGPT 就意味着用上了市面上最智能的工具。即使各种技术基准测试的意义逐渐减弱,保住这个心智定位也至关重要。
此外,我们确实构建了出色的产品功能。我认为与一年半之前相比,如今的记忆和个性化功能都非常吸引人,搜索功能也表现相当优异。我相信用户是真的喜欢我们的产品,复制它的成功比想象中要难得多,尽管从战略规划的角度,我们必须假设对手的成功。
另一件我认为其他公司有时会低估的事情是,用户的"使用意图"至关重要。举个例子,如果一个用户打开某款应用的目的是想漫无目的地刷刷信息流,此时突然弹出一个和 ChatGPT 功能类似的产品,即便它获得了曝光,用户也不会想使用它。很多仅仅出于好奇的点击,也未必能转化为深度的、持续的参与。
但话说回来,我们绝不能因为暂时领先就高枕无忧。我努力在向团队传递"第一天心态"(Day One Mentality)。对于一家仅有三年历史的公司来说,这还算容易。我们用户面临着大量新出现的、需要精妙解决方案的问题。因此,尽管增长势头喜人,但我们的工作还远未结束。
Alex Heath: 听众朋友们,他刚才暗指的是 Meta,以免大家混淆。
Nick Turley:[笑] 我这可是个开放式的陈述。
Alex Heath: 当然。
Nick Turley: 我刚刚描述的场景可以适用于很多公司。
AI 的幻觉问题
Alex Heath: 作为一名记者,阻碍我更多使用 AI 模型的主要因素是"幻觉"。根据 GPT-5 的模型信息卡,大约有十分之一的回答可能包含幻觉。这相比以前当然有所改善,但十分之一的错误率仍然不低。我想知道,你认为将幻觉彻底清零,在技术上是可行的吗?
Nick Turley: 我过去可能会说不。我认为我们必须基于幻觉会永久存在的现实来规划产品,这也是为什么为 ChatGPT 引入搜索功能的原因。我至今仍然坚信,正确的产品形态是"大语言模型+事实来源"的结合。
在企业应用中也是同理,当模型连接到你公司的内部数据时,我们就有了可以核对的事实依据。我认为这种基本模式不会改变。话虽如此,GPT-5 在抑制幻觉方面取得的进展让我大为震撼,它无论比聊天版的 4o 还是推理版的 o3 表现都好得多。
我们内部确实有些研究人员认为可以对消除幻觉抱有相对乐观的态度。然而在"非常可靠"和"100%可靠"之间,还是存在着一道巨大的、非连续性的鸿沟,这会从根本上改变你构思产品的方式。
在我认为我们能被证明在所有领域都比人类专家更可靠之前,我想我们会一直建议用户"核实答案"。人们会将 ChatGPT 用作获取"第二意见"的工具,而非首要的事实来源。
Alex Heath: 你认为一年后,你们就不用再提醒用户核实答案了吗?还是需要更长的时间?
Nick Turley: 我当然希望一年后能达到那个状态。所以我们会积极地去攻克那些对可靠性要求极高的应用场景。你可以想象,从医疗建议到法律咨询,如果能将 ChatGPT 用于这些准入门槛极高的领域,那将产生颠覆性的影响。
我不会强行去做关于时间的预测,我只能做出"最终会实现"的预测和"下一个季度"的短期预测,因为在这两者之间的时间段里,我们对具体会发生什么并没有那么了解。
我有信心最终能解决幻觉问题,我也确信我们下个季度解决不了它。
Alex Heath: 你们的路线图真的只规划未来六个月,这是真的吗?
Nick Turley: 是的,但有些例外情况。我真心希望人们能理解,在一个不断变化的技术基石上构建产品,是多么依赖经验、又是多么奇特的一件事,这是其他任何类型的公司都无需面对的。
对于我们绝大部分的功能而言,我们确实只能以未来六个月作为规划的路线图。然而,对于我们的企业业务而言情况就有所不同。如果一家世界500强公司问我们某项合规功能何时上线,我们必须能给出确切的答复。
我们很少会有一个超过六个月的高置信度目标,因为底层的一切都在以极快的速度变化。
ChatGPT 的产品形态
Alex Heath: 我这里有一个来自你一位前同事的匿名提问,他让我问你,为什么 ChatGPT 的产品形态至今没有发生更大的变化?
Nick Turley: 我也思考过这个问题。我想很多人现在都知道这个故事,但为了那些还不知道的人,我再讲一遍:
ChatGPT 最初只是为了验证某个更宏大的产品想法而制作的、用完即弃的产品原型。我们当时希望构建一个我们称之为"超级助理"的东西,一个能帮你做任何事的、形态灵活的实体。
而 ChatGPT 只是我们去实现这个想法的起点,我们单纯希望用它来收集足够的学习数据和用例,以便我们去构建那个"真正的产品"。
但后来事情显然完全偏离了轨道,因为 ChatGPT 一炮而红,取得了巨大的成功,远超我或我们任何人的预料。
自然语言本身是极其强大的,我认为这一点将永远存在。但它最终是否持续以聊天机器人的形式去呈现?这可能值得商榷。但我认为,让用户能用最自然的方式表达自己,这就是用户体验的终极形态。因为这正是我们人类被"编程"的方式。只要你是在为人类构建技术,你就必须让人们能用最自然的方式与产品沟通。
但是,我不认为"原生自然语言界面"就等同于"聊天"。一个早期的尝试是 Canvas 功能。它允许你与 AI 共同迭代一个作品,你们是在协作完成一件事,而不是来回对话。
再结合 GPT-5 强大的前端代码生成能力,你完全可以想象,AI 未来能根据不同的应用场景,去即时生成不同的用户界面,这是比 Canvas 更宏大的一个产品愿景。
想象下,当你在做数据分析时,它会为你生成一个电子表格;当你计划旅行时,它会为你生成一个小小的网页应用,方便你和朋友们共同规划;无数种不同的产品形态会自然涌现。
只能说在当时的技术水平下,聊天确实是最合适的界面而已。由自然语言驱动、但界面更丰富的体验将会非常非常酷。我也对我们至今仍在使用聊天机器人感到有些困惑,但我们对产品的未来抱有极大的雄心,我相信技术的发展将使所有的构想成为可能。
Alex Heath: 在谷歌反垄断案中,有份来自你团队的战略文件被披露,其中提到了这个"超级助理"的目标,并指出你们想构建的是人们通往互联网的"界面"。这意味着你们必须超越聊天,甚至需要进入网页浏览领域,关于这一点也有过媒体报道。
你本人甚至在谷歌反垄断案中出庭作证时表示,如果谷歌被迫分拆 Chrome,OpenAI 可能有兴趣收购。你们现在有在开发自己的浏览器吗?OpenAI 是否需要在 ChatGPT 之外,创建一个自己的网页浏览器?
Nick Turley: 那个说法被严重地断章取义了,我必须澄清一下——我当时完整的回答是,如果 Chrome 被挂牌出售,会有很多方考虑收购,我们也会是其中之一。
在产品层面,ChatGPT 正在成为互联网的一个新入口。很多你十年前需要用浏览器来做的事,现在直接在 ChatGPT 里就能完成,而且它会直接给你答案。
当它开始能为你处理更耗时、更复杂的任务时,比如我们之前提到的规划旅行或进行数据分析,这些事你过去可能需要打开三个不同的软件来完成,而未来你可能直接在 AI 里处理。
所以我不认为"ChatGPT 会取代浏览器"是个疯狂的想法。但它具体会以何种形式出现,就让我们拭目以待。我们正在探索各种可能性,我完全同意那个论点:ChatGPT 未来将不得不承担起越来越多今天由浏览器扮演的角色。
其他问题
Alex Heath: 好的,在我们剩下的几分钟里,我准备了一些"闪电问答"式的产品战略问题,希望能听听你的简短看法。
Sam多次提到,"用ChatGPT登录"是他眼中具有战略重要性的事:即让用户能带着他们的 ChatGPT 账户和个性化设置畅游整个网络,使其成为像谷歌或苹果登录一样的选项。你们在这方面进展如何?
Nick Turley: 我们正在积极探索。我从惨痛的教训中学到,当你要构建一个生态系统,而且试图让别的合作伙伴也在上面构建时,你必须慢慢来,把它尽可能做对,因为你试错的机会不多。我们一直在和很多合伙伙伴讨论推进这件事。
Alex Heath: 传闻说你们不会再和 Jony Ive 合作开发眼镜或手机,这是真的吗?
Nick Turley: 我无法对我们的硬件路线发表任何评论。
Alex Heath: 与苹果的合作进展如何?
Nick Turley: 非常棒,我对我们正在共同做的事情感到非常兴奋。我认为这是一个长期的合作关系,我非常期待能将 AI——当然更希望是我们的模型,但更广义地说是 AI 技术,带入 iOS 的每一个角落。
Alex Heath: 所以你预见与苹果的合作会进一步加深?
Nick Turley: 这个问题不在我的专业范畴,但从纯粹的产品视角来看,我看到了无数深化合作的机会。
Alex Heath: 你们宣布与芭比娃娃的制造商美泰公司合作,将你们的模型植入他们的玩具。为什么要这样做?
Nick Turley: 因为我们不仅是家产品公司,也是家平台公司。在我们提供自己的第一方产品同时,我们也非常乐意将我们的基础能力开放给所有人。这就是个典型的例子。
尽管我们涉足了很多领域,但不太可能涉足玩具制造业。这是一个绝佳的范例,它展示了别人可以利用我们的 API,在我们不涉足的行业里,打造出属于他们自己的业务和产品。
Alex Heath: ChatGPT 什么时候能实现完全的多模态?
Nick Turley: 我们的牵引目标是,你最终能像和真人一样与它交谈。这意味着,就像我们现在对话这样,可以互相打断,有很多微小的身体语言线索。
我认为归根结底就是要让用户能更容易地向 AI 表达自己,同时让 AI 也更容易地向用户表达自己。这才是完全释放这些模型智能潜力的关键。
我们的愿景就是"任何输入,任何输出"。但这远比实现纯粹的技术能力要困难得多,因为你需要让整个交互过程感觉"自然"。
你可能用过我们最新的语音模式,我认为它已经做得相当不错,但我仍然觉得它还没能完全通过所谓的"图灵测试",还是能感觉到人们在和AI对话。人类的互动中有太多我们渴望破解的微妙之处。
Alex Heath: 你们最近推出的四种模型新个性,这个个性化测试的终局是什么?是提供几十种甚至无限种个性供用户选择,还是让每个用户都能创造出完全属于自己的、独一无二的 ChatGPT 个性?
Nick Turley: 我们目前还不完全确定。我们非常期待能从这次发布的四种个性中先学习,观测用户的需求是否都集中在这几个类别里,还是说存在巨大的、多样化的长尾需求。
就我目前的想法而言,我认为应该允许用户自己配置模型的个性。我们已经有了"自定义"这样的功能,现在也有了这四种个性作为额外的初始配置、未来你会先选择一个最能与你产生共鸣的初始化配置,然后在此基础上,通过与产品的日常互动,或是通过明确的设置,来进一步进行个性化的调试。
我觉得这就像交朋友。你选择和谁做朋友,是基于你们现在的个性是否合拍。但随着时间的推移,你们之间的关系会继续磨合推进。





