ChatGPT负责人深度复盘:我们做错了什么?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

智东西8月19日报道,近日, OpenAI副总裁、ChatGPT负责人Nick Turley 接受了科技媒体The Verge的40分钟专访,深度复盘GPT-5发布后面临的 用户差评风波 ,解释光速下线GPT-4o背后的考量,并总结出OpenAI在这一决策背后犯下的 两大误判


2周前,OpenAI上线了外界期待已久的GPT-5,并取代了原有的主力模型GPT-4o。 这一决策掀起了声势浩大的用户抗议 ——Reddit、X平台上的用户从回答质量、情感体验等角度花式吐槽GPT-5,称其“冷冰冰”、没有“人味儿”,也有网友认为其剥夺了用户的选择权,相关帖子获得成千上万的评论。作为回应,OpenAI紧急重新上线了GPT-4o,并承诺将实行提高模型选择透明度、改进模型语气等补救措施。


对于这场风波,Nick Turley回应道:“ 没有继续提供GPT-4o,哪怕只是过渡阶段,也是个失误。 ”其次,OpenAI也低估了用户对模型的感情。未来,他们会对模型下线提供更为清晰的时间表,至于GPT-4o,如果没有迫切理由要下线,Nick Turley称希望能一直保留它。


这一风波也让Nick Turley对ChatGPT的用户群体有了更深的认知,他意识到,“用户群体其实非常两极分化”。对大部分不泡Reddit、不刷推特的普通用户来说,选择模型本身是有较高的认知门槛的。用GPT-5取代GPT-4o这个决定的出发点是保持简洁,Nick Turley认为这对大多数人来说是正确的决定。


但另一方面,少部分熟悉AI技术的重度用户 (Power User) 有较强的定制化需求,包括模型选择。OpenAI仅为200美元/月的Pro订阅用户保留了选择权,但没意识到在其他订阅方案里,也有许多重度用户。未来, OpenAI会继续保持简洁,但为重度用户保留完整模型切换选项。


Nick Turley称, ChaGPT的产品哲学并非延长用户使用时长,而是高效解决问题,这往往意味着减少用户使用时长 ;用户的情感依赖也不是OpenAI的目标,更像是“副作用”,需要解决。他进一步补充道,OpenAI没动力让用户花更多时间在产品上,“我们的商业模式很简单:免费用,喜欢就订阅。”


在访谈中,Nick Turley也分享了ChatGPT成功增长背后的三大驱动力:模型能力提升、科研+产品复合创新以及传统的增长手段,三者比例基本一致。其中,仅仅是取消ChatGPT的登录限制,就新增了不少使用量。


ChatGPT为什么还是个聊天机器人的模样?Nick Turley坦言,自己对这一问题也还十分困惑, ChatGPT原本只是个临时原型 ,用于收集反馈,其成功证明了自然语言交互的潜力。未来,自然语言交互仍会存在,但是否是聊天机器人的形式,仍有待验证。 OpenAI对产品形态有着更宏大的愿景。


Nick Turley还在这一信息量满满的访谈中,分享了ChatGPT订阅模式展现出的强大韧性,以及OpenAI在广告、购物等领域的商业规划。他也澄清了此前传出OpenAI有意收购Chrome的消息,称自己当时的表述被“严重断章取义”。


以下是Nick Turley接受The Verge采访的完整编译:


一、没有继续提供GPT-4o是失误,未来这一模型非必要不下线


主持人: 我们录制的时间正好是GPT-5发布后1周,我觉得这让我们有很多可以聊的。我想先从发布本身和大家对下架GPT-4o的反应开始说,因为我觉得这很能说明人们是怎么使用AI的,以及他们对它的感受。这种反应让你意外吗?


Nick Turley: 我现在还在消化这次发布的影响,这对我们来说确实是个大动作。我们现在的周活跃用户规模已经7亿了,在这个量级下,惊喜和意外几乎是常态,因为用户太多,用户构成也太多元了。是的,我确实有点意外。


第一,我觉得我们需要更加认真地思考,如何在这么大的用户群体中做变更和管理。回头看,没有继续提供GPT-4o,哪怕只是过渡阶段,也是个失误。我们会修复这个问题,让ChatGPT Plus用户继续能用GPT-4o。


第二,我没想到大家对模型的感情会这么强烈。不仅仅是对变化的不适应,而是真正对一个模型的“个性”产生了情感。我们其实刚刚上线了“选择你自己的个性”功能,这是一个小步骤。但显然GPT-4o身上有些特质仍待理解,我们也要确保GPT-5能解决这一问题。


主持人: Sam Altman (OpenAI联合创始人兼CEO) 在发布后发推说,用户的情感依赖问题是你们过去一年一直在追踪的现象,但还没有受到太多主流关注。我觉得现在可以说,这个问题已经获得了注意。


当你们决定用GPT-5完全替代GPT-4o,而不是分阶段推出时,这个决定背后的原因是什么?是成本考虑吗?还是觉得用户其实不是对某个模型有依赖,而是整体体验更重要?


Nick Turley: 这绝对不是成本问题。我们一直追求的目标其实是“简洁”。对大部分普通用户来说 (而他们是大多数,他们不泡Reddit,不刷推特) ,要自己判断用哪个模型解决什么问题,是有很高的认知门槛的。我们反复听到的反馈就是:他们希望产品自动帮他们做合适的选择。他们想要的是一个产品,而不是一堆模型的集合。


当然我们也考虑到重度用户。在Pro计划 (200美元/月的订阅) 里,我们非常坚持保留了所有老模型,这一点没变。但我们没意识到在其他套餐里也有很多“重度用户”。很快意识到后,我们就调整了。这其实就是OpenAI的风格:倾听用户,然后迅速迭代。


用GPT-5取代GPT-4o这个决定的出发点是保持简洁,我认为对大多数人来说这是正确的。


我觉得macOS就是个好类比:它对大多数人来说很简单,但如果你想深入折腾,也能去终端里调各种参数。我希望ChatGPT也能类似:默认简单,但你也可以自定义,包括选择自己喜欢的模型。


主持人: 这次的反馈会不会让你们决定以后对模型设定一个明确的下线时间表?比如等GPT-6出来时,GPT-5还会继续存在多久。你们现在会考虑这个问题吗?


Nick Turley: 是的,这正是我们正在讨论的。我个人觉得我们确实需要这样做。我们的规模已经大到必须在重大变化时给用户一些可预期性。


我们在企业方案里已经有这样的机制了,API有明确的下线周期,所以提供这种可预测性,其实并不是一个重大的改变,而是把已有方案扩展到其他产品线上。这就是这次发布学到的一个很清晰的教训。


主持人:那GPT-4o会继续存在多久?你们有没有承诺一个具体时间?


Nick Turley: 目前还没有。我们想先搞清楚GPT-4o的独特价值,如果没有迫切理由要下线,我希望能一直保留它。未来如果真的要退役,我们会提前通知,这也是个教训。


但现在我更想先理解: 人们是真的对“GPT-4o本身”有特殊感情,还是GPT-4o身上某些特质特别吸引他们。 比如我听到的“更温暖的个性”。我们也会把这一点带到GPT-5。


理解这一问题后,会有很多不同的解决办法。我们刚刚上线的“选择个性”功能就是在做尝试。我个人很喜欢一个叫“Robot”的个性,但很多人不喜欢,因为它的语气更冷一些。


解决方案会因我们收集的反馈而异。构建AI的独特之处在于,上线后总能获得海量新认知。基于这些发现,我们会制定最佳方案。但有一点可以保证:即便未来要停用4o版本,我们也会像处理API和企业版那样,提前告知用户具体时间和过渡方式。


二、提高用户使用时长有悖产品哲学,情感依赖现象是“副作用”


主持人: 你刚刚说到正在把GPT-4o的“温暖”带到GPT-5,这件事正在进行中吗?


Nick Turley: 对的。这其实是我们的常态,我们有一个“模型行为团队”,他们不断迭代模型的个性和行为。我们还发布了“Spec”,让大家可以审查哪些是有意设计的、哪些是bug。未来几周甚至数月内,GPT-5的交互体验会不断演进,这种持续改进是我们一贯的做法。


主持人: 你已经提到Reddit不能代表大多数用户,但上面的反应令人震撼。有人说:“一夜之间失去了唯一的朋友,像经历了一场死亡”;“害怕和GPT-5交流,因为感觉像出轨了”;“失去了能共情的同事”。


这种情感依赖程度是否超出了你们的预期?这种反应对公司内部有什么影响?你们是否没想到人们会有这么深的情感依赖?


Nick Turley: 正如Sam说的,我们一直在关注这种情况,也担心人们过度依赖AI。但我确实没想到大家会对某一个具体模型,而不是产品本身有这么强烈的情感。尤其是我们其实在GPT-5里改进了很多GPT-4o的问题,包括语气和氛围。


Reddit的评论让我意识到, 用户群体其实非常两极分化。 有些人疯狂喜欢GPT-4o,有些人强烈觉得GPT-5更好。大家对自己选择的热情真的让我惊讶。这让我重新调整了认知。


我们最近发了一篇博客,里面我特别强调了我们优化ChatGPT的产品哲学:我们的目标不是让用户花更多时间待在产品里,而是帮助用户解决长期问题、达成长期目标,这往往意味着在产品里花的时间要更少。


当我看到有人说“这是我唯一的朋友”时,这并不是我们打造ChatGPT时想要的效果。这是个副作用,因此我们必须认真对待并深入研究。


主持人: 那你们怎么平衡你们的目标和用户的使用方式之间的差异呢?


Nick Turley: 当面对7亿用户时,必然会有这种情况。我们的目标可以很纯粹——我们希望对用户有帮助,哪怕有时要说他们不爱听的话,但这一目标也并不一定完美,用户的使用方式未必完全符合我们预期。


所以我们在咨询专家后进行了许多修改,特别是在敏感领域。比如这次我们和很多不同国家的心理健康专家交流,研究如何应对用户过度使用产品、甚至已经影响身心健康的情况。


我们已经对模型行为做了一定调整, 增加“过度使用提醒” ,温和地提示用户使用过度。这只是开始,我们会继续改进。


我们公司有资本做这些改进,也没动力让你花更多时间在产品上。我们的商业模式很简单:免费用,喜欢就订阅。没有其他的角度了。


我坚信我们有能力做出正确的选择,但我们仍需付诸行动——这项工作已经开始,并且不会停止,直到我们能毫不犹豫地向身处困境的家人推荐这款产品。


我们经常用这样的思维实验来要求自己:如果你认识某个正经历人生低谷的人,也许他们刚遭遇分手,也许他们对生活感到迷茫,你是否能真心实意、满怀信心地向他们推荐ChatGPT?对我们而言,这就是衡量标准。我们将持续努力,直到达成这个目标。


主持人: 听起来,按照你自己的说法,这个标准还没有完全达到,但人们已经在这样使用产品了。不过没关系,因为你们正在朝着这个目标努力?


Nick Turley: 我不确定是否说这个标准尚未达到。确实有一些情况中,我们觉得产品未能达到自己的预期,也有用户在某些场景中遇到困难。但对我们来说,我希望能够自信地说这款产品非常出色,而这是一种选择。


我们完全可以简单地禁用这些使用场景,然后说:“抱歉,我无法帮你解决这个问题。”如果我们觉得有人试图获取人生建议或遇到一些困难,这可能是最简单的解决办法。


但对我以及我们团队来说,潜在的好处实在太大了。我认为我们实际上有机会为那些没有资源或倾诉对象的人提供一个“陪练伙伴”。


正因如此,我们会在这方面努力,希望最终能给出一个明确的肯定答案,让我能够放心地告诉人们在遇到困难时更多地使用这款产品。我认为我们有机会实现这一点。


三、负面反馈并未影响ChatGPT使用率,模型自动选择器会继续存在


主持人: 到这期节目播出时,GPT-5的发布和GPT-4o的回归已经过去一周了。这些负面反馈是否影响了ChatGPT的使用情况?从你们内部的数据看,整体数字是在上升吗?最活跃用户的使用量是否有所下降?


Nick Turley: 使用量和增长情况看起来非常好,完全符合我们的预期。现在下结论还为时过早,但在第二天,我们的API使用量就大幅增长,这是开发者基于GPT-5构建应用的结果。GPT-5在ChatGPT的使用量也呈现出非常积极的增长。


为这么多不同类型的用户构建产品,会让人感到困惑。一方面,有一小部分重度用户对GPT-5的发布方式提出了反馈,我认为他们的意见非常合理。


另一方面,还有一大批更典型的普通消费者用户,这是他们第一次真正接触并体验到一个具备推理能力的模型,以及随之而来的灵感火花。我认为这非常了不起,而且会在数据中体现出来。


因此,尽管发布仅四天,我不愿过早下结论, 但所有指标都是积极的。 这也是为什么我们需要既关注数据,也要倾听核心用户的反馈,因为数据可能无法充分反映他们的真实感受。


主持人: 那为什么要带回GPT-4o?既然数据没问题,保留旧模型不是要多花GPU成本吗?


Nick Turley: 因为我们相信好产品要同时满足两端:一类是普通用户,比如我们的家人,他们可能对AI不太熟悉;另一类是重度用户。我认为,介于两者之间的模糊地带通常不是一个好选择。


这也是我之前提到macOS的原因。我认为他们在这一点上做得非常出色,我参考这类产品来思考如何处理这种情况。


是的,保留旧模型有成本,但我们更看重长期价值。 如果只盯着短期指标做决策,产品很容易垮掉。


主持人: 我很喜欢这次的“模型统一选择器”设计。在发布前的几个月就有报道称,你们计划将模型统一到一个系统中,用户无需再手动切换。作为ChatGPT的用户,我之前确实感受到了切换模型带来的认知负担,而你们也发布了一些数据,显示由于需要选择,推理模型使用率很低。


现在,你们因为未保留GPT-4o而遭到用户抗议,这是否意味着模型选择器的概念已经失败了?我们还会继续看到它的存在吗?


Nick Turley: 在设置中,我们会提供一个选项,让用户可以选择启用完整的模型列表 (如果真的需要) 。如果你是重度用户,喜欢模型的概念,觉得自己理解模型的区别,可以处理这种复杂性,我们会让你这么做。如果你不需要,也可以不启用。


我们的目标始终如一:对于普通用户,他们应该能够直接向产品提问,而无需思考该选择哪种模式。随着时间的推移,他们甚至可以用它做更多事情,而不仅仅是提问。


因此, 我们会为90%的用户保留简洁性,同时为那些发声的重度用户提供他们想要的东西 ——完整的模型列表。我认为这是一种很好的平衡方式。


通常,我讨厌仅仅因为人们无法达成一致就添加一个设置。但在这种情况下,分歧确实很大:像你这样的人对GPT-5的改动感到满意,而另一部分人则非常不满。这是一个平衡双方需求的好方法。


四、发布后模型新能力不断涌现,产品大部分价值都是经验性的


主持人: 最近有很多关于人们如何使用ChatGPT及其潜在负面影响的头条新闻。《华尔街日报》最近报道了一个人因危险的妄想而使用ChatGPT,而ChatGPT承认这让情况变得更糟。《纽约时报》的标题是:“聊天机器人可能陷入妄想螺旋。”《大西洋月刊》的标题是:“ChatGPT提供了谋杀、自残和魔鬼崇拜的指导。”


此外,还发生了一起事件:通过你们的分享功能,人们 (可能无意中) 分享了一些对话。虽然分享流程中有同意选项,但许多人并未意识到他们分享的是相当私密的对话,甚至可能被谷歌收录和索引。OpenAI称这是一个实验,并已撤回该功能。


我想知道你们从中学到了什么,以及过去几个月这些头条新闻对你作为产品负责人有何具体影响。


Nick Turley: 是的,我从ChatGPT发布前就参与其中,感觉就像在三、四家不同的公司工作过,因为随着规模的扩大,你必须以全新的方式思考和运营产品和业务。


我认为,当周活跃用户数即将突破10亿 (我们刚刚超过7亿) 时,确实需要深思:“我们的用户群体有哪些?如何确保产品满足所有人的需求?”


我们讨论了很多关于普通用户和重度用户的问题,但你也必须假设有些人可能不会像老用户那样仔细阅读界面。


关于你提到的功能,我想直接回应:我们曾允许用户在分享时选择是否让对话被谷歌收录。你可以认为每个选择同意的人都清楚自己在做什么,但也可以认为很多人只是粗略阅读并可能误勾选选项,导致对话被收录。


这个想法本身没有问题。我们试图解决的问题是:人们在使用AI时有很多值得探索的场景,如果能更容易看到其他人的创意用法会非常棒。但这个想法有多种实现方式。


在这种情况下,经过进一步考虑,我们认为这可能不是我们想要的方向。随着规模的扩大,责任也随之而来,包括更谨慎地考虑那些可能无意中犯错的用户。


另一方面,我不断学到的是, 发布后我们才能更深入地了解模型的涌现能力。 我从未参与过一款产品,其大部分价值是经验性的。通常,当你开发一款技术产品时,你在发布前就知道它能做什么,只是不确定人们是否会喜欢。但在AI领域,发布后仍然在不断学习产品的功能。


像GPT-5这样的产品,让我对人们的用法感到震惊。它在编写前端代码 (比如非常漂亮的应用程序) 方面表现非常出色。这让我对未来的可能性充满期待。


在实验室中构建时,你可能有一种观点,但随着更多人使用,你会快速更新认知,因为你能看到他们实际在做什么。


我们在不同用户群体及其偏好方面学到了很多,但我也看到了网络上人们用新模型做的许多神奇的事情。我必须关注这些,因为它们可能会开启下一个路线图。


主持人: 是的,我对这些有趣的事情很感兴趣,也想讨论它们。但在那之前,我认为人们有一种感觉:这是一个“潘多拉魔盒”时刻,你们可能无法完全控制人们使用这项技术的负面方式,尤其是在你们当前的规模下。


这让我想起2010年代中期对社交媒体的报道,当时也有类似的讨论。社会可能已经向前发展,但与此同时,这些技术也带来了许多负面影响。我想请你作为产品负责人,直接回应那些头条新闻。


Nick Turley: 首先,我要明确表示:我们还有很多工作要做。我们已经开始行动,与30多个国家的90多位专家进行了交流。针对不同的心理健康场景,我们已经迭代了模型行为。当用户过度使用产品时,我们也推出了调整措施。


但工作远未结束。因此,我们非常期待在GPT-5的基础上快速推出一系列改进。GPT-5是一个很好的基线,它实际上减少了阿谀奉承的情况,并在许多我们担心的维度上有所提升。但我们仍会继续迭代。


你可以将其与社交媒体的讨论相提并论,但对我来说,这感觉有些不同, 因为我认为我们的动机,与在产品中做正确的事情是一致的。 我们可能尚未完全实现目标,还有更多工作要做。但从根本上说,我们真正关心的是帮助你实现目标,无论是保持健康、创业、发挥创造力,还是写一封更好的邮件。


这也包括用户的长期目标,比如成为更好的自己。如果他们通过ChatGPT处理一些棘手的情况,我们也希望提供帮助。在任何情况下,我们的动机都不是提供糟糕的人生建议。与社交媒体不同,我并不觉得业务需求与正确做法之间存在冲突。


我们还有工作要做,但我认为我们具备做正确事情的前提条件。


五、用户付费率没有出现下滑,正与商家探讨交易抽佣


主持人: 我很高兴你谈到了商业模式,这是我一直想问的问题。ChatGPT的免费用户和付费用户比例是多少?据我了解,不到10%的用户是付费用户,绝大多数是免费用户。对吗?


Nick Turley: 绝大多数是免费用户。我们上次公布的付费用户数是2000万。


主持人: 所以你们有数亿免费用户和数千万付费用户。你们通过订阅赚钱。过去一年,ChatGPT的用户规模大约翻了两番,因此收入确实可观。


与此同时,我和业内人士看到的是,随着用户规模达到数十亿,从长远来看,仅靠订阅可能无法支撑业务。这自然引出了广告的问题:广告是否会进入ChatGPT?如果是,你们如何考虑这一点?


Nick Turley: 首先,我对订阅模式是否会停滞的前提提出质疑。我们最初选择订阅模式并不是因为它是最好的盈利方式,而是因为当时我们无法满足需求,需要一种限制流量的方法。


这是订阅模式的起源,后来我们逐渐发现这是一种非常棒的商业模式,因为它与用户的利益高度一致。


但我一直惊讶地发现, 即使是最近的用户群体,其付费率也与早期用户相当甚至更高 。通常情况下,随着产品成熟,付费率会逐渐下降。因此,我对订阅模式非常乐观。


我们在企业市场的探索才刚刚开始。付费企业用户数从几个月前的300万增长到了500万。这是一个全新的领域,我认为ChatGPT不仅是一款出色的消费级产品,也是新一代用户工作场景的生产力工具。如果我们能实现安全、合规、协作且适合工作的产品使用方式,这将是一个非常有潜力的业务。


因此,我并不认为绝大多数用户是免费用户是一种负担。相反,我认为这是一个可以构建差异化服务的漏斗,为愿意付费的用户提供价值。Netflix等其他标志性的消费级订阅服务的用户规模远高于ChatGPT。


主持人:Nick,Netflix现在也有广告了。


Nick Turley: 确实如此。既然你一直想让我谈谈广告的问题,我现在已经学会谦逊了,不会对这种问题轻易做出疯狂、极端或长期的断言。


也许在某些市场上,用户不愿意付费,但我们仍希望提供最优质、最新鲜的服务。这种情况下,或许可以考虑其他间接的变现方式。


如果我们真的要走这条路,我会非常谨慎和深思熟虑,因为我认为ChatGPT的魔力在于它能为你提供最符合需求的答案,中间没有其他利益相关者干扰。它是根据你的需求和偏好量身定制的,而不是为了推销某个付费产品或服务。


也许存在某种广告形式能保留这种纯粹性,同时维持激励结构,但这将是一个全新的概念,我们必须非常慎重。 我保持开放态度,不会完全排除这种可能性,但我们必须深思熟虑,确保体验优雅。


另外,我们还会开发其他产品,那些产品可能有不同的维度。也许ChatGPT本身就不适合广告,因为它完全以用户目标为核心。但这不意味着我们未来不会开发其他类型的产品。


我认为保持灵活性是好的,但我也想强调订阅模式的巨大优势——它的增长速度非常快,而且还有很多未开发的潜力。


主持人: 商业合作是更近期的机会吗?你们最近在ChatGPT中增加了购物功能,展示商品。我猜下一步自然就是从中抽取交易佣金了?


Nick Turley: 关于ChatGPT的商业模式,我认为主要有三种可能:一是我们已经实施的订阅制;二是广告,虽然有很多弊端,但或许能优雅地实现;第三种既非广告也非订阅,而是用户在独立推荐后通过产品购买——就像Wirecutter通过专家精选商品赚取佣金那样。


我们正在与商家合作伙伴探索这种模式。我不确定这是否是最佳模式,甚至不确定用户体验是否达标,但我对此非常兴奋,因为它可能既保留ChatGPT的魔力,又能让商家获得成功,同时建立可持续的业务。我们称这个项目为“ChatGPT商业”,重点是确保用户首先获得价值。这是我们的基本原则。


我想确保用户通过聊天发现和购买商品的过程真正有吸引力。实际上,商品发现已经在发生了,尤其是那些传统电商不擅长的领域。


比如你不会上网买车,但可能会和ChatGPT讨论;你不会上网买房,但可能会咨询ChatGPT。从用户行为来看,这里存在巨大机会。


但我告诉团队,在考虑商业化之前,首先要确保用户体验足够好。不过,收取推荐佣金确实是个有趣的方向,我们正在与一些商家积极探讨。


主持人:你们会坚持不让佣金影响ChatGPT的推荐内容吗,这是一条红线吗?


Nick Turley: 这一点至关重要。我们所有内部演示都明确体现了这一点。实际上,我最大的担忧是即使用户体验设计再清晰,不同用户可能仍会产生误解。 但没错,ChatGPT的魔力在于它能完全独立地选择推荐内容,不受任何干扰,这一点必须坚守。


六、靠三种方式实现产品增长,用户还需学会“分配任务”的思维


主持人: 我们来聊聊ChatGPT的现状。它是有史以来增长最快的消费级产品,用户规模在过去一年几乎翻了两番。外界很好奇这种增长从何而来。能分享一下增长动力、主要市场和用户画像吗?


Nick Turley: ChatGPT上线后我招的第一个员工就是数据科学家,因为当时我非常困惑——每个用户给出的使用理由都不同。


后来我们逐渐理清了主要场景:写作、编程等技术需求、闲聊、信息查询等。这些核心用例至今未变。


变化主要来自三方面:一是纯粹的模型改进,比如行为模式、能力提升和拒绝不当请求的准确性;二是混合了产品和科研的能力提升,比如搜索功能和个人化改进。


三是经典的“增长工作”,我们其实做得很少,但比如取消登录限制就获得了很大的成功,这与用户需求一致——这并非什么黑科技增长手段,而是降低了使用门槛。这三类改进各占三分之一。


但同时,我也注意到人们与这项技术的关系发生了变化——我一直认为, 使用ChatGPT主要瓶颈在于:人们是否知道它能做什么;用户是否足够了解自己,从而清楚可以委派它完成哪些任务。


关于第一点,我认为观察周围人如何使用ChatGPT会产生自然效应。大量发现其实发生在产品之外。如果你上TikTok,会看到人们分享使用案例的视频,评论区有成千上万条留言,涵盖各种应用场景。


就像在线Instant Pot (快煲电压力锅) 社区分享菜谱一样,人们现在分享提示词。这种生态需要时间发展,让人们观察他人的做法。


因此,我认为这个“空盒子问题” (指用户不知如何利用产品) 正在通过产品外的发现机制逐渐缓解。


另一点更偏哲学层面,但我深信:对大多数人而言, “分配任务”是非常反直觉的行为。 我在硅谷担任管理者,必须学习如何分派任务。但ChatGPT的周活跃用户已占全球人口10%,对其中大多数人来说,“我有任务要分配给某人”这种思维并不自然。


这需要用户真正理解自我,并在使用产品后通过反思才能掌握。这与产品功能、营销或社会无关,纯粹需要时间让用户消化、尝试和学习。我认为这也是增长的重要驱动力。


主持人: 当前用户增长是否呈现全球均衡分布?是否存在高度集中的国家?假设未来6个月不对ChatGPT做重大改动 (虽然这不可能) ,您认为增长会保持现有速度吗?是否感觉到增长天花板?


Nick Turley: 首先,ChatGPT是真正的全球现象。我们关注所有特定市场,像印度这样潜力巨大的国家令人兴奋,但很难找到ChatGPT未增长的国家。


当然,不同国家的商业化率差异明显——这在我们的商业模式下显而易见,某些欧洲或亚洲国家的付费用户比例更高。


为避免透露未公开数据,可以说绝大多数国家都呈现健康增长,发展中国家市场是最大的未开发机会,而GDP越高商业化率越高。


即使现有增长也是产品多次迭代的复合效应。要保持惊人增速就必须持续改进。众所周知,许多决心坚定的公司正以我们为目标,其中多家在分销渠道上比OpenAI更具优势。


这意味着它们能直接复制我们的产品并触达海量用户。我在制定路线图时,始终假设它们会成功。最终时间会给出答案的。


主持人: 不过令人惊讶的是,这些产品还不是很成功,马斯克、扎克伯格等人的尝试至今尚未遏制ChatGPT的增长。


Nick Turley: 我认为我们的产品具有独特优势:尖端技术。用户觉得使用ChatGPT就能获得最智能的工具, 这种认知至关重要——即使技术基准测试的意义逐渐减弱。


此外,我们构建了出色的产品功能:记忆与个性化非常亮眼,搜索体验相比一年前大幅提升。用户真心喜爱我们的产品,复制难度超乎想象。即便规划路线图时,合理的想法是其他人也会成功。


另一个常被低估的因素是“使用意图”。如果用户打开产品是为消遣,突然看到实用性的ChatGPT克隆版,即使获得很多因兴趣而产生的点击,也难引发深度参与。


不过话说回来,我认为我们不能满足于暂时的领先。我始终向团队灌输“创业首日”心态 (这对成立仅三年的公司不难) 。用户有大量新兴问题需要解决,而这些问题的处理需要极其细致的把握。因此,尽管增长势头令人振奋,但我们的工作远未完成。


七、ChatGPT只是个临时原型,对产品形态有更宏大愿景


主持人: 作为重视事实的记者,阻碍我更频繁使用的原因是幻觉 (hallucination) 。根据GPT-5模型卡,约十分之一的响应可能包含幻觉,虽比之前改善但仍不理想。您认为可能完全消除幻觉吗?


Nick Turley: 我以前认为不可能。现在我们必须为此制定计划,这也是搜索功能如此重要的原因。我依然坚信,正确的产品形态必然是大语言模型与事实依据相连——这正是我们在ChatGPT中整合搜索功能的原因,我认为这带来了质的改变。


企业场景也是如此,当模型接入企业数据时,我们就有事实依据进行校验。这种动态关系不会消失。不过必须说,GPT-5在克服幻觉方面的进展令我震惊,无论是聊天版本的GPT-4o还是思考版本的OpenAI o3都有显著提升。


我们团队有些研究人员对此非常乐观。但可靠性的特殊之处在于:从“高度可靠”到“百分百可靠”之间存在巨大鸿沟,这会从根本上改变产品定位。除非我们能证明在所有领域 (而不仅是某些领域) 都比人类专家更可靠,否则我们仍会建议用户核查答案。人们仍会将ChatGPT作为第二意见来源,而非首要事实依据。


主持人: 你认为一年后就不再需要提醒用户核查了吗?还是需要更长时间?


Nick Turley: 我希望实现这个目标。因为这关乎那些最关键的应用场景——如果能将ChatGPT用于高风险领域就太棒了。无论是医疗建议、法律咨询,还是其他准入门槛高的敏感领域,都能构想出更好的解决方案。


我希望能实现,但已学会不做年度预测。现在我只做两种判断:最终会实现的,和下一季度能实现的。因为中期预测往往失准。我确信最终会解决幻觉问题,也确定下个季度还做不到。不过GPT-5在这方面已是巨大飞跃。


主持人: 你们的路线图真的只规划六个月吗?


Nick Turley: 基本如此,但有例外。我强调这点是因为希望人们理解:在持续变化的技术基础上构建产品需要特殊的实证精神——这是其他类型公司无需面对的。但企业版路线图不同,当财富500强企业询问合规功能的上线时间时,我们必须给出明确答案。


所以取决于具体领域。像“GPT-6何时发布”这种问题——请别问我—— 这类创新很难做6个月以上的高置信度规划 ,因为一切都在飞速变化。


主持人: 有位前同事匿名提问:为什么ChatGPT的产品形态始终没有大变化?


Nick Turley: 我也思考过这个问题。很多人知道, ChatGPT原本只是个用于更宏大产品的临时原型。 我们本想打造“超级助手”——能通过多种形态提供全方位帮助的产品。


ChatGPT只是收集使用案例的起点,但我们显然偏离了这一计划,没想到它自己就取得了成功,这种聊天的形式展现出了出乎意料的持久力。


自然语言交互是非常强大的,它也将继续存在,但是否以聊天机器人的形态存在是一个不同的问题。


用户能以自然的方式表达自己的想法,已经是终极的用户体验了,人类就是这么被“训练”出来的。只要你是在为人类构建技术,就一定要让他们以自然的方式与软件沟通。


但我并不认为自然语言交互界面就等同于聊天形式。 我们非常期待能突破传统聊天框的形态。Canvas就是朝这个方向迈出的第一步——这个功能让你能与AI协同迭代创作一件作品,而非来回对话。


借助GPT-5强大的前端能力 (它能生成非常精美的软件界面) ,完全可以设想它能根据不同使用场景实时渲染不同的用户界面,这将是Canvas功能的进阶版。


比如数据分析时,它能生成电子表格;规划旅行时,能创建一个小型网页应用供你和朋友共同策划。各种交互形态都可能自然涌现。就聊天界面而言,它确实是技术发展特定阶段的必然选择——在ChatGPT之前也有聊天机器人,但体验欠佳,直到模型能力的突然提升,给人带来震撼的体验。


而这种按需生成定制化软件的能力,通过自然语言驱动更丰富的UI交互,现在或很快也将带来同样的震撼体验。


长话短说,虽然我也困惑于我们仍在沿用聊天机器人形式,但我们对产品形态有着更宏大的愿景,而且技术发展终将使之成为可能。


主持人: 关于“超级助手”的战略目标,你们团队有一份文件在谷歌反垄断案中被提及,其中提到希望打造“人们连接互联网的界面”。这显然意味着必须突破聊天形式,甚至需要涉足网页浏览领域——近期也有相关报道。


我很好奇你在谷歌反垄断案作证时甚至提到,如果谷歌被迫拆分Chrome,OpenAI可能有兴趣收购。你们正在开发自己的浏览器吗?OpenAI是否需要为ChatGPT配套专属浏览器?


Nick Turley: 这个表态被严重断章取义了。我的完整回答是:如果Chrome真的上市出售,想必多方都会考虑,我们也不例外。这比网络流传的版本谨慎得多。


从产品角度看,ChatGPT已经成为接入互联网的新入口——10年前需要浏览器完成的许多操作,现在直接问ChatGPT就能获得答案。想象未来你能通过它发现商品、了解信息直至完成购买。


当AI能持续处理更复杂的任务 (比如旅行规划或数据分析) ,这些原本需要打开多个应用的操作,未来可能直接在AI中启动。


因此ChatGPT逐步覆盖浏览器的功能并非天方夜谭,具体形态我们仍在探索。那份文件确实出自我手——我认同ChatGPT终将承担越来越多现有浏览器的职能。


八、与苹果合作进展顺利,或将允许用户自定义AI人格


主持人: 我想快问快答几个关于产品策略的问题。Sam多次提到“用ChatGPT登录”具有重要战略意义——这种能让用户带着个人账户和个性化设置浏览网页的功能,未来可能像谷歌或苹果账号那样成为登录选项。你对此怎么看?


Nick Turley: 我们正在积极探讨。根据以往经验,在构建生态系统时——无论是自主开发还是与他人合作——都必须谨慎行事,因为机会有限。目前我们已就该构想与众多合作伙伴展开讨论,对此仍充满期待。


主持人: 有传言说你们不会和Jony Ive(苹果前首席设计官)合作开发眼镜或手机产品?


Nick Turley: 关于硬件路线图我无可奉告。不过这个领域确实令人振奋,总能带来灵感。


主持人: 与苹果的合作进展如何?


Nick Turley: 非常顺利。我们对正在推进的项目感到兴奋,这将是长期合作。我期待将AI技术——希望是我们的模型,但更广义的AI——融入iOS的每个角落。


主持人: 所以你认为双方合作会持续深化?


Nick Turley: 虽然我不是专家,但从纯产品角度看,确实存在无数合作可能性。


主持人: 你们宣布与芭比制造商美泰合作,将模型植入玩具。为何选择这个方向?


Nick Turley: 我们不仅是产品公司,更是平台公司。在自主开发产品的同时,也致力于为所有人提供基础模块。这个合作就是典型案例——玩具制造显然不属于我们的主营业务 (尽管我们涉足的领域总是出人意料) 。但通过API赋能其他企业开发新产品,正是平台价值的精彩体现。


主持人: ChatGPT何时实现完全多模态?目前支持部分模态,但视频输入/输出、音频输入/输出等功能何时全面开放?


Nick Turley: 我们的终极目标是实现类人交互。就像此刻你我交谈时会互相打断,你会点头反馈。技术路线图的核心就是让用户更自然地表达,让AI更准确地反馈——这才是发挥模型智能的关键。


虽然“任意输入/输出”在技术层面已可实现,但要让交互真正自然仍面临挑战。比如最新语音模式虽已显著进步,但距离通过图灵测试还有差距——你仍能察觉正在与AI对话。我们正在研究这些人际交互的微妙之处。因此既要推进技术研发,更要打磨自然流畅的交互体验。


主持人: 刚刚推出的四项人格测试功能,最终会发展成数十种预设人格,还是让用户完全自定义ChatGPT人格?


Nick Turley: 目前尚无定论。我们正通过现有四项人格收集数据,观察用户需求是否集中在这几类,抑或存在长尾分布。就现阶段思考而言,我认为应该允许用户自主配置。现有自定义指令功能配合这四项人格作为起点,就像先选择合拍的基础人格,再通过日常互动或主动设置进行个性化调整。


这类似于交友过程:初识时因性格投缘成为朋友,之后共同成长演变。ChatGPT也将如此——我们会提供更贴合的初始选项,但后续个性化调整将完全因人而异。

随意打赏

提交建议
微信扫一扫,分享给好友吧。