热门资讯> 正文
2025-07-18 10:57
AI播客:换个方式听新闻 下载mp3
OpenAI终于加入了AI智能体的竞争行列。这家生成式AI初创公司推出了ChatGPT Agent,允许其聊天机器人代表用户执行多步骤任务,包括安排会议、制作演示文稿,以及使用代码终端或网页浏览器等工具。
这一新功能目前仅对付费用户开放。Pro订阅用户每月可使用多达400次智能体提示,而Plus和Team用户每月限额为40次。企业和教育用户的访问权限预计将在未来几周内开放。
这一举措紧随过去12个月内谷歌、Salesforce和HubSpot等大型科技公司在智能体AI领域的重金投入之后。这也正值OpenAI上周刚宣布推出自家浏览器,紧跟Perplexity AI的步伐。
据OpenAI介绍,ChatGPT Agent“融合了三项早期突破的优势:Operator与网站交互的能力、深入研究的信息整合能力,以及ChatGPT的智能与对话流畅度”。
用户可以让ChatGPT执行如“查看我的日程并根据最新新闻简要说明即将举行的客户会议”或“分析三家竞争对手并制作一份幻灯片演示”等指令。
智能体运行在其自有的虚拟计算机上,可在多种工具间切换,包括文本浏览器、可视化浏览器、代码终端,以及第三方应用连接器如Gmail和GitHub。
OpenAI表示,这种组合让模型能够“从推理到行动无缝衔接,完整处理复杂的工作流程”。
OpenAI称,ChatGPT Agent专为协作而设计。用户可以随时打断、接管浏览器或在任务进行中重新指派,ChatGPT会随之调整。
公司在博客中写道:“它会从中断处继续,并根据新信息更新,但不会丢失之前的进度。”
然而,该工具尚不支持实时响应。在演示中,ChatGPT Agent花费约25分钟才基于公司财报生成一份幻灯片演示。
产品负责人Yash Kumar表示,很多任务用户可以“在后台启动,之后再回来查看”。研究负责人Isa Fulford补充说:
“即使需要15分钟或半小时,跟用户自己手动做相比,这已经是很大的效率提升。”
由于安全原因,一些功能(包括记忆)在首次发布时被禁用。Kumar告诉The Verge:“并不是我们认为它不安全,而是我们采取了额外的谨慎措施。”
OpenAI表示,ChatGPT Agent背后的模型在多项基准测试中显著超越了之前的技术版本。
但此次发布伴随着更高风险。OpenAI在其内部“预备框架”中将该模型归类为具有“高生物和化学能力”,这一分类适用于模型可能“加剧现有通往严重危害的路径”的情况。OpenAI称:“虽然我们没有确凿证据表明该模型可以实质性帮助非专业人员制造严重的生物危害——这是我们划定‘高能力’的标准——但我们正在谨慎行事并立即实施必要的防护措施。”
公司表示,已采取新措施以降低现实世界滥用风险,包括在执行不可逆操作前要求用户明确确认,以及“监视模式”,要求用户监督高风险任务(如发送电子邮件或与金融网站互动)。
OpenAI还引入了防止提示注入的保护措施。提示注入是指恶意指令隐藏在智能体可能在线遇到的内容中。该公司写道:
“因为ChatGPT Agent可以直接采取行动,成功的攻击可能产生更大影响并带来更高风险。”
不过,OpenAI强调,今天的发布“只是一个开始”。公司计划随着时间推移不断提升Agent的能力并进行优化。
OpenAI表示:“我们预计ChatGPT Agent的效率、深度和多样性将持续改进,包括实现更顺畅的交互。”