ChatGPT化身生活操作系统：奥特曼预告下一代顶级AI

AI快讯 2025-06-30

OpenAI 计划发布一个极为强大的开源模型，这一消息引发了 AI 领域的广泛关注。该模型具备让人们在本地运行强大模型的能力，或将彻底改变人们对 “本地部署” 的认知。

这一消息是 OpenAI 的奥特曼在旧金山 AI 初创学校的对话中宣布的。此次对话由 Y Combinator 的首席执行官 Garry Tan 主持，他们在交流中探讨了 OpenAI 的发展历程、未来走向、ChatGPT 的起源，以及 AI 硬件的构建等诸多关键话题。

奥特曼在对话中提到，o3 模型的运行成本下降趋势明显，上周的运行成本还是本周的 5 倍，并且 API 的成本也将会持续大幅下降。他坚信，即将推出的开源模型会带来意想不到的惊喜。

ChatGPT 的记忆功能也有了新的发展方向，它不再仅仅是一个简单的硬件功能，而是逐渐演变成类似 AI 伴侣的存在。从长远来看，GPT-5 以及多种推理模型将朝着集成模型的方向发展。这些集成模型会与 AI 智慧终端、机器人相互连接，最终成为人们生活中的操作系统。奥特曼还透露了一个令人期待的消息：如果用户注册最高级别的 ChatGPT 订阅，将会获赠一个机器人。

GPT 推理模型的未来

Garry Tan 询问奥特曼，最新的 o3 型号最让人感到惊讶的地方是什么，以及目前有哪些新兴行为或用例令人印象深刻。

奥特曼表示，当下正处于一个充满机遇的时代。尽管目前还未出现具有创新性突破的推理模型产品，但模型能力已经迈入了新的阶段，未来还有许多未知等待探索和开发。他强调，OpenAI 很快就会推出一款开源模型，其表现将远超人们的预期，届时人们能够在本地设备上运行功能强大的模型。同时，API 成本的持续下降，也会让开源模型的应用更具优势。

谈到记忆功能时，奥特曼称这是今年推出的功能中他最喜欢的。在他看来，记忆功能代表了产品未来的发展方向 —— 人们将拥有一个智能实体，它能够深入了解用户，连接用户的各种设备和信息，并主动提供帮助。这个智能实体将在后台持续运行，实时监测用户的情况，主动推送消息或执行任务。未来还会出现新型设备，它会与用户使用的各项服务深度集成，伴随用户的生活。当这个系统不断运行并推送内容时，用户与它的交互也会变得更加丰富。而且，首款新设备推出后，还会带来更多新功能。他还提到，这一系统的关键并不在于硬件本身，而是它能够在后台运行，给人一种人工智能伴侣的感觉。

Garry Tan 提到 LMS 与真实数据集成的强大功能，并表示听说 MCP 即将登陆 OpenAI。他询问奥特曼，实际整合过程中有没有令人惊讶的地方。奥特曼认为，人们已经开始将 ChatGPT 当作操作系统来使用，把生活中的各种事务都融入其中。将尽可能多的数据源进行整合，再结合始终伴随用户的设备（如新型网络浏览器）、与数据源的连接、内存以及持续运行的模型，会构建出一个功能强大的系统。

对于模型未来会在云端、桌面还是两者都有的部署方式问题，奥特曼认为会是多种方式的融合。他希望能将一半的聊天工作负载推送到本地设备上，这样可以减轻云端压力，提高用户体验。同时，他相信 OpenAI 很快就会运行世界上最大且最贵的基础设施，为云端服务提供强大支持。Garry Tan 好奇在云端运行的计算难度是否超乎想象，奥特曼表示，OpenAI 擅长从无到有地构建事物，就像ChatGPT.com在两年半前还不存在，如今已发展成为世界第 5 大网站。

GPT-5 和多模态超级模型的愿景

Garry Tan 问道，o3、o4mini 推理模型与像 4o 这样的多模型并行发展，当这些线程汇聚时会产生怎样的结果，以及 GPT-5 及以后的发展愿景是什么。

奥特曼表示，虽然无法通过 GPT-5 实现所有目标，但最终期望打造一个集成模型。这个模型具备强大的功能，在需要时能够进行深度推理，还能生成实时视频。比如当用户提出一个问题，模型会像人一样认真思考，进行研究，甚至编写代码，就如同为用户开发一个全新的应用程序。他认为这将是一种全新的计算机界面形式，目前 AI 在一定程度上已经有了类似的表现，但当拥有真正完整的多模态模型，实现完美的视频、编码以及深度推理时，其功能将无比强大。

奥特曼还谈到机器人领域的发展。他表示团队的策略是先攻克多模态模型的问题，然后确保将其应用到机器人上。他坚信机器人时代即将来临，当用户注册最高级别的 ChatGPT 订阅时，OpenAI 会免费赠送一个机器人。虽然机器人的机械工程和 AI 认知能力都面临着挑战，但整体上团队正在逐步掌握这些关键技术。他预计几年后机器人就能承担一些实用的工作，但要制造十亿个机器人并实现自动化供应链，还需要一定的时间。

Garry Tan 提到有人说最近是 “agent 之年”，有了操作员代码解释器这样的工具，询问奥特曼哪些工作流程可能会消失或出现，而目前人们还未做好准备。奥特曼认为，长期以来 ChatGPT 就像 Google 的高级搜索版本，但现在可以将任务交给类似 codeex 这样的工具进行深入研究，它能够反馈相关建议，就像一个初级员工在短时间内完成某项工作。他认为凭借当前的 o3 模型就能实现很多类似的体验，未来的模型会带来更多可能。

Garry Tan 询问奥特曼如何看待人机交互和界面的未来，以及现有界面的哪些局限性促使他产生这样的思考。奥特曼认为，目前的语音界面体验不佳，而理想的人机交互界面应该是让用户可以对电脑说：“这正是今天我想要完成的事，如果我被耽搁了或有任何变化，我相信你会在不打扰我的情况下，去做所有事。” 除非界面能像超级棒的人类助手一样，否则它应该尽可能简化甚至消失。他希望能为人们展示一种全新的电脑使用方式。

AI for Science：Sam 的个人赌注

Garry Tan 展望未来十到二十年，询问奥特曼个人最期待的发展方向，以及现在人们应该构建什么来实现这样的未来。

奥特曼表示，他期待看到一个超级智能的世界，其中 AI 在科学领域的应用让他最为兴奋。他认为世界上长期可持续的经济增长以及改善人们生活的关键，在于发现新的科学知识，并建立完善的治理机构来推动科学的发展和共享。如果能够利用 AI 提升科学探索的速度，将会为人类带来巨大的进步和奇迹。

OpenAI 发展：人才吸引与竞争力

Garry Tan 称赞奥特曼善于聚集优秀人才，询问他在招聘方面学到的最深刻的教训是什么。奥特曼认为，招聘真正聪明、有动力且具备高效团队合作能力的人至关重要，这能让公司的成功概率提升 90%。他强调要招聘业绩良好、好奇心强、积极融入工作并且与公司愿景一致的人。在创业初期，他不建议招聘那些履历辉煌但可能不适合创业节奏的人，而是选择年轻有活力、能够高效完成任务的人。他通常会询问应聘者做过的最令自己印象深刻的事情是什么。

Garry Tan 询问奥特曼，担任 OpenAI 的 CEO，最大的挑战是什么。奥特曼表示，公司必须同时处理多项任务，并且要应对来自大公司的各种竞争挑战。这需要花费大量精力，还需要灵活切换决策方式，以应对不同但同样重要的问题。

Garry Tan 为想要创建 B2B、SAS 的软件工程师提问，如何在当下完成复杂的任务。奥特曼认为，现在是科技史上创业的最佳时机。初创公司相比大公司具有迭代速度快、成本低的优势，虽然大公司有很多资源，但它们的迭代速度较慢。他建议创业者换个角度看待挑战，认识到行业变化带来的机遇，快速迭代产品，这样初创公司在竞争中会处于有利地位。他还提到，创业者可以思考如何建立防御性领域，以应对未来的竞争。

Garry Tan 询问奥特曼，如果能回到学生时代，他会对自己说些什么。奥特曼希望有人能教会自己长期坚持信念和保持韧性，因为很多人在经历一次失败后就选择放弃，学会坚持非常重要。同时，他还希望自己能培养对直觉的信任，并不断完善决策和直觉，因为成功带来的收获比想象中更美好，而困难的部分往往难以用言语表达，只有坚持下去才能取得成功。