OpenAI掌门人最新专访：GPT-4o让我爱不释手，下代大模型或不叫GPT-5

一块革命砖 · 发表于 2024-5-16 07:10:28

这么看GPT-4o确实很有意思，我都想和它聊聊了[哭笑]

今夜阳光明媚 · 发表于 2024-5-16 07:13:23

GPT-4o确实很强，互动能打断插嘴，几乎没有延时，能够理解人的情绪和语气，比如说急促语气里会自行判断为紧张，并做出响应的行为答复。[哭笑][哭笑]

路高 · 发表于 2024-5-16 07:18:10

印象最深的就是实时语音对话了，感觉一定程度上代替一些亲密关系了

火箭尾翼 · 发表于 2024-5-16 08:45:07

所以有了这玩意之后，人类究竟还需不需要交朋友？[哭笑][哭笑][哭笑]

蓝色兔兔女孩 · 发表于 2024-5-16 09:05:06

腾讯科技讯 5月16日消息，据国外媒体报道，OpenAI近日发布了其最新的大语言模型GPT-4o，再次引领了人工智能领域的又一创新浪潮。在此重要时刻，该公司首席执行官山姆·奥特曼（Sam Altman）接受了知名播客节目主持人罗根·巴特莱（Logan Bartlett）的专访，向全球观众揭开了发布会背后的精彩故事，并提供了他对人工智能未来的预测。
在这次专访中，奥特曼不仅详尽地阐述了OpenAI的宏大蓝图，还探讨了实现AGI（通用人工智能）的时间表，以及人形机器人可能带来的深远社会影响。与此同时，奥特曼也对人工智能个人助理的前景表达了自己的兴奋与忧虑，并强调了当今人工智能领域最大的机遇和风险等。
以下为奥特曼与巴特莱对话全文：
01 领导OpenAI让我再难保持“透明”

巴特莱：让我们从较为轻松的话题开始吧！在过去的四五年里，作为OpenAI的领导者，你的生活经历了哪些最不寻常的变化？换句话说，哪些转变对你来说是最为明显的？
奥特曼：许多事情都发生了变化。但其中最令人惊异的是，我再也无法在公众面前保持“透明”。如果之前我稍微预想过这一点，我可能会说，这比想象中更为奇特。但当时我确实没有多想。这就像一种非常特殊的“隔离状态”，让我有些无所适从。
巴特莱：你深信人工智能和OpenAI的力量，那么，在经营这样一家公司时，你有没有预想过它可能带来的连锁反应？
奥特曼：我并未预料到这些。我并没有想到会牵涉到这么多其他的事情，比如公司会成长为一个真正具有影响力的企业。我更加没有预见到，我甚至在自己的城市里都无法自由地外出用餐，这确实让我感到有些奇怪和不可思议。
02 发布多模态AI：技术的一大飞跃

巴特莱：本周早些时候，你们成功发布了多模态大模型GPT-4o，它实现了在文本、语音和视觉之间的无缝交互。你能谈谈为何这一突破如此重要吗？
奥特曼：这无疑是计算机使用方式的一次革命性飞跃。长久以来，我们都有通过语音控制计算机的愿景，如Siri等早期产品。但对我而言，它们的使用体验从未真正达到自然流畅的境界。然而，GPT-4o在使用感受上与前代产品截然不同。它的表现非常自然，这源于多方面因素的完美结合：它功能的丰富性、融入其他模型的迅捷性、语调的自然流畅，以及它所能实现的多样化操作，比如你可以轻松地对它说“嘿，说得更快一点”或者选择另一种声音。这种流畅性和灵活性——无论我们如何称呼它——都让我对新模型爱不释手。
巴特莱：请分享一下你目前更偏好的一些用例场景。
奥特曼：尽管我才使用了一周的时间，但有一个用例让我颇为惊喜。当我全神贯注于工作时，我可以简单地将手机置于桌面之上，而无需频繁地切换窗口或打断我的工作流程。这手机仿佛成为了我与信息之间的另一个桥梁。
举个例子，当我处理某个任务时，我过去常常需要停下来，去其他标签页搜索资料或点击其他链接。而现在，我可以继续手头的工作，直接提问并立即获得响应，而不必转移视线离开我当前在电脑上处理的内容。这种无缝衔接的体验确实令人称奇。
巴特莱：听起来，这一切的背后是技术架构的演进，特别是计算能力的飞跃？
奥特曼：确实，从技术角度来看，这基于我们过去几年在多个领域的积累。我们一直在深入探索音频模型、视觉模型，并努力将它们融合。同时，我们也在探索用更高效的方法来训练我们的模型。这并不是说我们突然之间就拥有了一个革命性的新功能，而是将众多技术元素巧妙地结合在了一起。
巴特莱：考虑到延迟问题，你认为是否需要在设备上开发专门的模型来确保流畅的交互？
奥特曼：对于视频来说，网络延迟确实是一个需要关注的问题。我一直对AR眼镜或其他设备能够实时地与世界交流、感知事物变化的前景充满期待。但网络延迟确实可能成为这一愿景的绊脚石。不过，在实际应用中，两三百毫秒的延迟已经足够迅速，很多时候甚至能超越人类的反应速度。
巴特莱：你最近提到GPT-4o可能不是下一个大型版本的命名，比如GPT-5。这似乎意味着你们在模型开发上采用了更为灵活和迭代的方法。我们是否应该这样看待未来的发展方向？
奥特曼：未来发布的大模型不会是一个标志性的大版本，如GPT-5，因为目前我们还无法确定。我认为，我从中学习到的一点是，人工智能与传统的发布模式并不总是完美契合。科技公司通常遵循着既定的产品发布模式，但我们现在可能需要采取一种不同的策略。我们当然可以沿用GPT-5这样的命名，并以新的方式发布，或者也可以考虑使用其他名称。但我认为，我们还在摸索如何为这些产品命名和建立品牌。
从GPT-1到GPT-4的命名方式对我来说是合乎逻辑的，而GPT-4显然已经取得了显著的进步。我们也在思考，是否会有一个类似“虚拟大脑”的基础模型，在某些情况下可能展现出更深入的“思考能力”。或者，我们也可能探索不同的模型，但用户可能并不关心这些模型之间的差异。因此，我认为我们还在探索如何将这些产品推向市场。
巴特莱：这是否意味着，为了模型取得渐进式进步，我们对计算能力的需求可能会低于历史水平？
奥特曼：我认为，我们总是渴望利用尽可能多的计算能力。然而，现在我们正在见证惊人的效率提升，这无疑是至关重要的。最近发布的亮点之一是语音模式，但也许更核心的是，我们能够以如此高的效率运行它，以至于我们可以向全球用户提供这一服务，而且它的性能达到了世界上顶尖模型的水准。对于希望免费体验ChatGPT的用户，你会发现，GPT-4o与之前的GPT-4和GPT-4 Turbo相比，在某些使用场景下效率方面有显著提升。而且，我认为在这方面我们还有很大的提升潜力。
03 自然语言将成为人与AI主要交流方式

巴特莱：你曾提到ChatGPT本身并没有真正改变世界，它可能只是改变了人们对世界的期望。
奥特曼：是的，我完全认同这一观点。如果以任何经济指标来衡量，你很难找到确切的证据证明ChatGPT确实提高了生产力或产生了其他直接的经济效益。可能在客户服务或某些特定领域有一些体现，但如果你观察全球GDP的走势，你能在ChatGPT发布时明显检测到它的影响吗？恐怕不能。
巴特莱：你认为是否有一个时间点，我们可以确定GDP的增长是由ChatGPT推动的？
奥特曼：我不确定我们能否将这一增长直接归因于某个特定的模型。但我认为，如果我们回顾几十年后的历史数据，我们会看到一系列模型如何逐步推动整个领域的发展，ChatGPT只是其中的一部分。
巴特莱：你认为在接下来的12个月里，哪些应用或领域将展现出最有前途的发展？
奥特曼：由于我个人的工作背景，我自然对编程领域有关偏爱，我坚信这是一个至关重要的领域。
巴特莱：你曾详细讨论了深度专业化模型与通用模型的区别，前者针对特定数据训练并用于特定目的，而后者能够进行真正的推理。
奥特曼：我敢打赌，未来是通用模型大放异彩的时代。
巴特莱：在你看来，什么才是最为重要的？
奥特曼：对于那些仅仅局限于一个数据集和与之紧密相关的狭窄领域的模型来说，如果它们能够拥有泛化推理的能力，那么无论面对何种新的数据类型，只需输入相应的数据，模型便能够迅速适应并运行。但这样的能力并不是通过堆砌一堆专业化的模型所能获得的。因此，我认为最重要的是要弄清楚真正的推理能力，这样我们便可以将其应用于各种场景和任务中。
巴特莱：在设想人工智能在通信和创造力方面的前景时，你认为在未来两年内，人类与人工智能之间的主要交流方式将是什么？
奥特曼：自然语言无疑是一种非常有效的交流方式。我对于这样一个想法很感兴趣：我们可以设计一个人类和人工智能都能共同使用的机制，让它们以相同的方式互动。因此，相比于其他形式的机器人，我对人形机器人更感兴趣。因为当前这个世界在很大程度上是为人类设计的，我不希望因为追求某些所谓的“效率”而让这个世界重新配置。我倾向于这样的观点，即我们使用人类习惯的语言与人工智能交流，他们之间甚至可能采用同样的方式进行交流。尽管我无法预知未来，但我认为这是一个值得探索的有趣方向。
04 未来AI系统将变得便宜又好用

巴特莱：你曾提到模型可能会随着时间的推移逐渐商品化，但在这之前，是否应该首先将模型个性化到每个个体？
奥特曼：这一点我并不确定，但我认为这是一个值得考虑的方向。
巴特莱：除了个性化之外，你认为商业用户界面和易用性是否会在最终赢得用户青睐方面发挥重要作用？
奥特曼：当然，这些因素一直都是至关重要的。你可以想象，在某些情况下，市场或网络效应也会成为关键因素。我们希望智能主体之间能够进行有效的交流，应用商店里有不同的公司提供各种服务。但我认为，商业规则通常都会适用。每当新技术出现时，人们总是说这些规则不再适用，但这样的观点往往是不准确的。
在我看来，尽管开源模型在性能上正逐步接近基准标准，但传统价值创造的方式依然扮演着不可或缺的角色。对于开源模型的崛起，我持乐观态度。正如众多技术流派所展示的那样，开源有其独特的地位，而托管模型亦然，这种多元化的格局非常棒。
巴特莱：关于具体的实施细节，我并不打算深入探讨。但众所周知，不少权威媒体已广泛报道了投资FAB（半导体制造设施）和人工智能基础设施的消息。台积电、英伟达等公司正在积极增产，以满足市场对人工智能基础设施的激增需求。你最近曾提及，全球对人工智能基础设施的需求远超过目前台积电、英伟达等公司的供应能力，你是基于哪些观察或数据得出这一结论的？
奥特曼：首先，我确信我们能够找到途径，大幅降低现有人工智能系统的成本。其次，随着成本的降低，人工智能系统的需求势必将激增。第三，通过构建更大、更先进的系统，我们还将进一步刺激需求的增长。我们共同期待的是一个“智能”极其丰富且便宜的世界，人们可以利用智能技术完成各种各样的任务。你甚至无需思考，比如我是否想要它帮我阅读并回复所有电子邮件，或者我是否想要它帮我治疗癌症。当然，你会选择治疗癌症，但理想的情况是它能够同时出色地完成这两项任务。我关注的是确保我们拥有足够的资源，让每个人都能享受到智能技术带来的益处。
巴特莱：我并不要求你对个人努力做出评价，但如果你愿意分享，我想请教你对于Humane、Limitless等公司推出的不同物理设备助手有何看法？你认为它们有哪些不足之处，或者为何它们的普及程度尚未达到预期的用户需求？
奥特曼：我认为这仅仅是一个开始。作为多种计算设备的早期使用者，我有着丰富的体验。我曾拥有一台紧凑的TC1000，那是我大学一年级时的爱物，它虽不如现在的iPad先进，但方向无疑是正确的。后来，我拥有了一部Treo，在大学时代，我算是那种不太追求时尚的孩子，但我的Palm Treo在当时绝对是个炫酷的存在，尽管它与后来的iPhone相去甚远，但我们都见证了科技的飞跃。这些设备都预示着极具潜力的未来，只是需要时间的打磨和技术的迭代。
巴特莱：你最近曾提及，许多以GPT-4为基础建立业务的公司将不可避免地会被未来的GPT迭代所淘汰。你能进一步详细解释这一观点吗？此外，你认为在GPT的浪潮中，哪些具备人工智能特性的企业能够生存下来？
奥特曼：我发现一个适用的框架是，构建业务时，你其实是在做两种选择：要么赌下一个模型表现平平，要么赌下一个模型会取得显著进步并从中受益。如果你投入大量精力去让某个用例高效运作，而这个用例当前已超出GPT-4的能力范围，一旦GPT-5或后续版本出现并超越这一切，那么你可能会对你先前的努力感到不值。但如果你有一个全面且可行的产品，人们会自然寻求使用它，而你并没有过度投入去让这一产品成为唯一，那么当GPT-5或其他更先进的模型出现时，你的产品将随之变得更好。
我的观点是，大多数时候，你并非在建立一个纯粹的人工智能业务，而是在构建一个业务，人工智能只是你采用的一种技术。在应用商店的早期阶段，有很多产品填补了某些明显的空缺，但随后苹果解决了这个问题，我们现在已经不再关注应用商店里的手电筒应用，因为它们的功能已被集成到操作系统中。这将是未来人工智能业务可能的发展方向。至于优步这样的企业，它们因智能手机的普及而兴起，但它们建立了一个非常稳固且长期可行的业务模式，我认为这正是我们应该追求的方向。
巴特莱：我明白你的意思，而且我能想象出很多应用你们技术理念的企业，它们在某种程度上都符合这一框架。那么，你能否给出一个具体的例子或新型概念，它符合我们之前讨论的模式？例如，Uber这样的公司，它不必是一个真实存在的企业，即使是一个假设性的公司、一个玩具概念，或者只是你认为以这种方式实现的某个想法也可以。
奥特曼：在这个方面，我倾向于押注那些新兴的初创企业。举个例子，当人们想要构建人工智能医生或人工智能诊断系统时，他们会说，“我不想在这个领域创业，因为你知道有梅奥诊所（Mayo Clinic）或其他医院会这样做。”但我实际上更看好那些在这个领域尝试新方法的初创公司。
05 没有AGI，OpenAI估值能达到万亿美元？

巴特莱：对于有志于主动应对此类颠覆性变革的创业者，你有何建议？
奥特曼：我要说的是，坚信智能服务会逐年进步、并且成本下降是必需的，但这还不足以确保你的成功。大公司虽然需要时间来达到这一点，你可以借此优势超越它们，但同样意识到这一点的其他创业公司也会这么做。因此，你仍需深入探索业务的长期可持续性。如今，我们面临的是一个前所未有的开放环境，充满了令人兴奋的新机遇，但请不要因此忽视了在创造价值过程中的辛勤工作。
巴特莱：鉴于人工智能的飞速发展，你能否预测在未来五年内可能涌现或成为主流的新职位类型？这些职位可能是当前鲜为人知或尚未存在的。
奥特曼：这是一个新颖且引人深思的问题，我之前并未被问及过。人们总是关注哪些职业将会消失，但新的职业类别同样令人着迷。我尝试思考的是，例如有1亿或5千万人可能会涉足的新领域。这可能涉及全新的艺术形式、娱乐方式，以及更加注重人与人之间的联系。虽然我不知道这些职位的具体名称，也无法确定我们是否能在五年内达到这样的规模，但我坚信，人们将会珍视像面对面这样独特的人类交流体验。我不清楚我们将如何定义这样的岗位，但我可以预见，这将成为我们未来发展中一个全新且极其重要的领域。
巴特莱：最近OpenAI在融资过程中估值达到了约900亿美元。在你看来，有哪些关键性事件或里程碑，即使OpenAI尚未达到AGI水平，也能推动其估值达到万亿美元？
奥特曼：我认为，只要我们能够继续以当前的速度提升技术，明确如何持续利用它构建出色的产品，并确保收入稳步增长，就像目前的情况一样，那么我坚信我们会取得巨大成功。关于具体的数字，我确实无法预测，但我对我们的未来充满信心。
巴特莱：当前的商业模式（可能指的是ChatGPT等订阅模式）是否是你认为OpenAI能达到万亿美元估值的关键因素？
奥特曼：这种订阅模式对我们而言效果非常显著，超出了我的预期。我原本并未预料到它会如此成功，但事实证明，它运作得相当出色。
巴特莱：在你看来，AGI（无论这个概念如何定义）实现后，商业模式会否发生变化？
奥特曼：那将是另一番景象。
巴特莱：关于OpenAI的现有结构，尽管我们可能已经注意到了一些改进，但我认为我们无需再对此深入讨论。你已经充分阐述了这一点。你提到会在前进过程中进行调整，那么在你看来，一个合适的结构应该是怎样的？
奥特曼：我认为我们即将准备好探讨这个问题了。我们一直在进行各种讨论和头脑风暴。我希望在今年，即这个日历年内，我们能够正式讨论这个问题。
巴特莱：关于人工智能的普遍看法，有一个特别有趣的话题是你的货币化模型观点。我们曾听你提及，首先是取代体力劳动，然后是白领工作，最后是创意工作。显然，这在某些方面被现实所颠覆。还有没有其他与直觉相悖的事情？例如，我原本认为会是这样，但事实却截然相反。
奥特曼：这对我来说确实是一个巨大的意外。除了你提到的那一点，还有其他一些事情，比如我没想到人工智能会如此擅长法律工作，并且会这么早就展现出这样的能力。因为我一直认为法律工作是非常精确和复杂的。
巴特莱：关于人工智能和你对“AGI”这个词持保留态度，你能详细解释一下吗？
奥特曼：因为我知道AGI不再是一个明确的时间点。显然，当你创办一家公司时，你会有很多天真的想法，特别是在这样一个快速发展的领域。OpenAI成立之初，我也曾天真地认为，我们将从没有AGI的时代开始，然后实现AGI，这将是一个真正的飞跃。我仍然认为有可能出现真正的飞跃，但总的来说，我认为它更像是一个连续的指数曲线，重要的是每年取得的进步速度。你和我可能在某个月或某一年达到AGI的具体时刻上不会达成一致。但我们可以想出其他我们会认同的测试方法，然而，这要比听起来要难。
GPT-4肯定没有达到我认为的AGI的阈值，我也不认为我们的下一个大模型会达到这样的水平。但我觉得，我们可能只是缺少某些不太起眼的想法，以及更大一点的规模，就能达到某个让人的程度。
巴特莱：那么，是否存在一个更现代的图灵测试，可以衡量人工智能是否达到了某个特定的阈值？
奥特曼：我认为，当某个系统能够做得比所有OpenAI的研究人员加起来还要好时，哪怕只是超过其中一位OpenAI的研究人员，这都将是一个非常重要的里程碑，感觉它可能会，甚至应该被视为一个突破性的进展。但这样的进展是否即将到来，目前还不太确定，但我不会完全排除这种可能性。
巴特莱：在你看来，实现AGI所面临的最大挑战是什么？你似乎认为当前的扩展定律在未来几年内仍将持续有效。
奥特曼：我坚信，实现AGI的最大障碍在于新的研究突破。自从我从互联网软件领域转向人工智能，我深刻体会到研究并不总是遵循预设的时间表。这通常意味着它可能需要更长时间，但有时候，进展的速度也会远超任何人的预期。
巴特莱：能否详细解释一下，为什么研究的进展并不像工程那样呈现出线性的趋势？
奥特曼：当谈及研究进展的非线性特征时，我想借由历史案例来阐述。尽管我可能会在一些具体数字上有所出入。以中子为例，它在20世纪初被在理论上提及，并在20年代首次被探测到。而原子弹的研究始于30年代，并在40年代成功实现。从对中子一无所知，到能够制造原子弹并颠覆我们对物理学的认知，这一进程展现了惊人的速度。
还有其他例子，如不那么纯粹的科学领域。莱特兄弟曾预测飞行将在50年后实现，而他们在1908年就成功进行了首次飞行。类似这样的例子在科学和工程的历史中不胜枚举。当然，也有很多我们预测中的进展从未实现，或者实现的速度远低于我们的预期。但有时候，进展确实能够异常迅速。
巴特莱：关于可解释性，我们目前在这一领域处于怎样的位置？它对人工智能的长期发展有多关键？
奥特曼：可解释性涉及多个层面，包括我是否理解网络在机械层面上的每一层运作方式，或者我是否能够通过查看输出来指出其中存在的逻辑错误。我对OpenAI以及其他机构在可解释性方面的研究充满期待。我认为，作为一个更广泛的领域，可解释性具有巨大的潜力和令人兴奋的前景。
（持续更新中......）

上一篇：4月29日马斯克大规模解雇特斯拉超充员工的内幕
下一篇：Uzi训练赛紧急叫停，TES成为受害者！拳头官方下场，G2还在坚持

沙雕剧本杀 · 发表于 2024-5-16 09:05:28

这么强大的模型竟然免费，让中国公司研发出来不收你一个月一百，那真是对不起大家[嘿嘿]

皓吃喵 · 发表于 2024-5-16 10:15:32

GPT-4o，你可以把它当成你最好的知心朋友，它没有任何负面情绪，并且比人懂得更多，甚至能察言观色，这是人类史上的一个伟大的进步

中级会员	积分	兔币	帖子
中级会员, 积分 419, 距离下一级还需 81 积分	419	235	184
在线时间：0 小时	最后登录：2024-7-27

中级会员	积分	兔币	帖子
中级会员, 积分 446, 距离下一级还需 54 积分	446	280	222
在线时间：0 小时	最后登录：2024-7-27

中级会员	积分	兔币	帖子
中级会员, 积分 415, 距离下一级还需 85 积分	415	257	202
在线时间：0 小时	最后登录：2024-7-24

高级会员	积分	兔币	帖子
高级会员, 积分 551, 距离下一级还需 449 积分	551	306	245
在线时间：0 小时	最后登录：2024-7-24

中级会员	积分	兔币	帖子
中级会员, 积分 466, 距离下一级还需 34 积分	466	300	234
在线时间：0 小时	最后登录：2024-7-24

[科技] OpenAI掌门人最新专访：GPT-4o让我爱不释手，下代大模型或不叫GPT-5

精彩评论6

对越反击战后遗症：36年云南伤残百姓6000人

奥运开幕式美国凭什么独享一船，中国只能“

美股七巨头的“至暗时刻”：2万亿美元市值

五大行集体下调存款利率？利率都这么低了为

vivo 明年发布 MR 头显，投注 3D 影像

温氏股份预计2024上半年扭亏为盈，四兄妹去

打疯了：恭喜商竣程晋级四强！再获利好消息

美军公开宣称将介入仁爱礁，中美军事摊牌恐

房贷利率进入“2时代”！多地商贷利率逼近

成全董宇辉？俞敏洪没有那么单纯

《花少好友记》刚播完，《花少6》就开录，

欣慰！已故羽球新星张志杰将获中国体育运动

起底百亿独角兽，背后高人到底是谁？

胡兵谈和瞿颖关系：“她，是我的家人，独一

孩子早产男子微信请假回家遭开除，法院：公

中印外长会谈，印度外长：愿与中国解决分歧

47岁大S素颜苍老，本人回应不在意只关心孩

担心“超雄综合征”会犯罪？他们比你预想的

Gary Gensler下台倒计时？谁会是下一届SEC

努比亚Z60S Pro正式发布：卫星通信+8Gen2 2

森林北穿深V装小秀性感，新疆街头被偶遇，

食用油怎么选购？炒菜用啥油更香？做到心中

讲真，是时候买房了

地球班故事：中东22国军官赴华参加研讨班，

浙大女学霸卖螺丝刀，雷军“代言”

白军方：若主权受威胁，将使用核武器

半价抛售，传递了什么楼市信号？

沈东军和莱绅通灵说“拜拜”

这就是一炮弹能打过台湾海峡的新巨炮？

好惨！上市公司高管被撕票，为出海业务拼掉

财神驾到

一抹伤

哇哇的哭

绿林道的

willlin