有一位员工用它来自动办理每周在旧金山 OpenAI 办公室的停车申请
OpenAI 正在全力押注当下最热的人工智能趋势:AI 代理,也就是比聊天机器人更进一步的工具,能够代表用户完成复杂的、多步骤的任务。
本周四,OpenAI 推出了“ChatGPT 代理”,他们称这个工具可以使用自己的“虚拟电脑”代你完成工作。
这个新工具由 OpenAI 专门为这个产品开发的最新模型驱动。这个新工具可以完成一些实际任务,比如查看用户的日程安排提醒即将举行的客户会议、规划和购买做家庭早餐的食材,以及根据分析竞争对手公司制作幻灯片。
ChatGPT Agent背后的模型没有特定的名称,它通过强化学习接受了复杂任务的训练,这些任务需要多种工具,比如文本浏览器、可视化浏览器和终端,用户可以导入自己的数据,这与OpenAI所有推理模型使用的技术相同。OpenAI表示,ChatGPT Agent结合了其现有的两种人工智能工具Operator和Deep Research的功能。
为了开发这个新工具,公司把负责Operator和深度研究的两个团队合并成一个统一的团队。库马尔和富尔福德告诉《泰晤士报》,这个新团队由大约 20 到 35 人组成,涵盖产品和研究两个部门。
实际用例:
在演示中,库马尔和富尔福德展示了 ChatGPT 代理可能的用例,比如让它连接到谷歌日历,帮你规划一个约会之夜,找出你有空的晚上,然后再查阅 OpenTablew 网站,帮你找到某些类型餐厅的空闲座位。
他们还演示了用户可以在过程中插入新要求,比如加个其他的餐厅类别来继续搜索。另一个演示则展示了 ChatGPT 代理如何生成一份关于 Labubus 和 Beanie Babies 崛起的研究报告。
富尔福德说,她喜欢用它来网购,因为 Deep Research 和 Operator 结合起来,效果比单靠 Operator 做得更好、更全面。而库马尔则说,他已经开始用 ChatGPT Agent 来自动化生活中的一些小事情,比如每个星期四在 OpenAI 请求新的办公室停车位,而不是每次都忘了提前申请,结果找不到停车位,然后一大早跑去。
库马尔说,因为 ChatGPT 代理能访问“整个计算机”,而不是只局限于浏览器,所以他们“大大增强了工具箱”。
不过据演示来看,这个工具有点慢。谈到延迟问题时,库玛说他们团队更关注“优化一些难的任务”,用户也不需要坐在那里盯着 ChatGPT 代理在工作。