ChatGPT化身生活操作系统:奥特曼预告下一代顶级AI

AI快讯 2025-06-30
OpenAI 计划发布一个极为强大的开源模型,这一消息引发了 AI 领域的广泛关注。该模型具备让人们在本地运行强大模型的能力,或将彻底改变人们对 “本地部署” 的认知。


这一消息是 OpenAI 的奥特曼在旧金山 AI 初创学校的对话中宣布的。此次对话由 Y Combinator 的首席执行官 Garry Tan 主持,他们在交流中探讨了 OpenAI 的发展历程、未来走向、ChatGPT 的起源,以及 AI 硬件的构建等诸多关键话题。


奥特曼在对话中提到,o3 模型的运行成本下降趋势明显,上周的运行成本还是本周的 5 倍,并且 API 的成本也将会持续大幅下降。他坚信,即将推出的开源模型会带来意想不到的惊喜。


ChatGPT 的记忆功能也有了新的发展方向,它不再仅仅是一个简单的硬件功能,而是逐渐演变成类似 AI 伴侣的存在。从长远来看,GPT-5 以及多种推理模型将朝着集成模型的方向发展。这些集成模型会与 AI 智慧终端、机器人相互连接,最终成为人们生活中的操作系统。奥特曼还透露了一个令人期待的消息:如果用户注册最高级别的 ChatGPT 订阅,将会获赠一个机器人。

GPT 推理模型的未来

Garry Tan 询问奥特曼,最新的 o3 型号最让人感到惊讶的地方是什么,以及目前有哪些新兴行为或用例令人印象深刻。


奥特曼表示,当下正处于一个充满机遇的时代。尽管目前还未出现具有创新性突破的推理模型产品,但模型能力已经迈入了新的阶段,未来还有许多未知等待探索和开发。他强调,OpenAI 很快就会推出一款开源模型,其表现将远超人们的预期,届时人们能够在本地设备上运行功能强大的模型。同时,API 成本的持续下降,也会让开源模型的应用更具优势。


谈到记忆功能时,奥特曼称这是今年推出的功能中他最喜欢的。在他看来,记忆功能代表了产品未来的发展方向 —— 人们将拥有一个智能实体,它能够深入了解用户,连接用户的各种设备和信息,并主动提供帮助。这个智能实体将在后台持续运行,实时监测用户的情况,主动推送消息或执行任务。未来还会出现新型设备,它会与用户使用的各项服务深度集成,伴随用户的生活。当这个系统不断运行并推送内容时,用户与它的交互也会变得更加丰富。而且,首款新设备推出后,还会带来更多新功能。他还提到,这一系统的关键并不在于硬件本身,而是它能够在后台运行,给人一种人工智能伴侣的感觉。


Garry Tan 提到 LMS 与真实数据集成的强大功能,并表示听说 MCP 即将登陆 OpenAI。他询问奥特曼,实际整合过程中有没有令人惊讶的地方。奥特曼认为,人们已经开始将 ChatGPT 当作操作系统来使用,把生活中的各种事务都融入其中。将尽可能多的数据源进行整合,再结合始终伴随用户的设备(如新型网络浏览器)、与数据源的连接、内存以及持续运行的模型,会构建出一个功能强大的系统。


对于模型未来会在云端、桌面还是两者都有的部署方式问题,奥特曼认为会是多种方式的融合。他希望能将一半的聊天工作负载推送到本地设备上,这样可以减轻云端压力,提高用户体验。同时,他相信 OpenAI 很快就会运行世界上最大且最贵的基础设施,为云端服务提供强大支持。Garry Tan 好奇在云端运行的计算难度是否超乎想象,奥特曼表示,OpenAI 擅长从无到有地构建事物,就像ChatGPT.com在两年半前还不存在,如今已发展成为世界第 5 大网站。

GPT-5 和多模态超级模型的愿景

Garry Tan 问道,o3、o4mini 推理模型与像 4o 这样的多模型并行发展,当这些线程汇聚时会产生怎样的结果,以及 GPT-5 及以后的发展愿景是什么。


奥特曼表示,虽然无法通过 GPT-5 实现所有目标,但最终期望打造一个集成模型。这个模型具备强大的功能,在需要时能够进行深度推理,还能生成实时视频。比如当用户提出一个问题,模型会像人一样认真思考,进行研究,甚至编写代码,就如同为用户开发一个全新的应用程序。他认为这将是一种全新的计算机界面形式,目前 AI 在一定程度上已经有了类似的表现,但当拥有真正完整的多模态模型,实现完美的视频、编码以及深度推理时,其功能将无比强大。


奥特曼还谈到机器人领域的发展。他表示团队的策略是先攻克多模态模型的问题,然后确保将其应用到机器人上。他坚信机器人时代即将来临,当用户注册最高级别的 ChatGPT 订阅时,OpenAI 会免费赠送一个机器人。虽然机器人的机械工程和 AI 认知能力都面临着挑战,但整体上团队正在逐步掌握这些关键技术。他预计几年后机器人就能承担一些实用的工作,但要制造十亿个机器人并实现自动化供应链,还需要一定的时间。


Garry Tan 提到有人说最近是 “agent 之年”,有了操作员代码解释器这样的工具,询问奥特曼哪些工作流程可能会消失或出现,而目前人们还未做好准备。奥特曼认为,长期以来 ChatGPT 就像 Google 的高级搜索版本,但现在可以将任务交给类似 codeex 这样的工具进行深入研究,它能够反馈相关建议,就像一个初级员工在短时间内完成某项工作。他认为凭借当前的 o3 模型就能实现很多类似的体验,未来的模型会带来更多可能。


Garry Tan 询问奥特曼如何看待人机交互和界面的未来,以及现有界面的哪些局限性促使他产生这样的思考。奥特曼认为,目前的语音界面体验不佳,而理想的人机交互界面应该是让用户可以对电脑说:“这正是今天我想要完成的事,如果我被耽搁了或有任何变化,我相信你会在不打扰我的情况下,去做所有事。” 除非界面能像超级棒的人类助手一样,否则它应该尽可能简化甚至消失。他希望能为人们展示一种全新的电脑使用方式。

AI for Science:Sam 的个人赌注

Garry Tan 展望未来十到二十年,询问奥特曼个人最期待的发展方向,以及现在人们应该构建什么来实现这样的未来。


奥特曼表示,他期待看到一个超级智能的世界,其中 AI 在科学领域的应用让他最为兴奋。他认为世界上长期可持续的经济增长以及改善人们生活的关键,在于发现新的科学知识,并建立完善的治理机构来推动科学的发展和共享。如果能够利用 AI 提升科学探索的速度,将会为人类带来巨大的进步和奇迹。

OpenAI 发展:人才吸引与竞争力

Garry Tan 称赞奥特曼善于聚集优秀人才,询问他在招聘方面学到的最深刻的教训是什么。奥特曼认为,招聘真正聪明、有动力且具备高效团队合作能力的人至关重要,这能让公司的成功概率提升 90%。他强调要招聘业绩良好、好奇心强、积极融入工作并且与公司愿景一致的人。在创业初期,他不建议招聘那些履历辉煌但可能不适合创业节奏的人,而是选择年轻有活力、能够高效完成任务的人。他通常会询问应聘者做过的最令自己印象深刻的事情是什么。


Garry Tan 询问奥特曼,担任 OpenAI 的 CEO,最大的挑战是什么。奥特曼表示,公司必须同时处理多项任务,并且要应对来自大公司的各种竞争挑战。这需要花费大量精力,还需要灵活切换决策方式,以应对不同但同样重要的问题。


Garry Tan 为想要创建 B2B、SAS 的软件工程师提问,如何在当下完成复杂的任务。奥特曼认为,现在是科技史上创业的最佳时机。初创公司相比大公司具有迭代速度快、成本低的优势,虽然大公司有很多资源,但它们的迭代速度较慢。他建议创业者换个角度看待挑战,认识到行业变化带来的机遇,快速迭代产品,这样初创公司在竞争中会处于有利地位。他还提到,创业者可以思考如何建立防御性领域,以应对未来的竞争。


Garry Tan 询问奥特曼,如果能回到学生时代,他会对自己说些什么。奥特曼希望有人能教会自己长期坚持信念和保持韧性,因为很多人在经历一次失败后就选择放弃,学会坚持非常重要。同时,他还希望自己能培养对直觉的信任,并不断完善决策和直觉,因为成功带来的收获比想象中更美好,而困难的部分往往难以用言语表达,只有坚持下去才能取得成功。

One More Thing

有趣的是,在这次对话没过几天,奥特曼就公开发起了一项投票:o3-mini 水平的模型将在哪一年能在手机上运行?截至文章完稿前,参与投票的网友中,超过 40% 的人认为该模型在 2025 年便可在手机上运行,大家都在期待这一时刻的到来。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章