FWQ
AI代理将如何影响我们的生活?
2025似乎是代理人工智能(Agentic AI)的年份。OpenAI、微软、Anthropic以及其他主要科技公司发布了他们最先进的人工智能模型,能够执行去年还无法完成的复杂任务。但是,AI代理到底是什么?这项技术真实的成分和炒作的成分各占多少? 跟上近年来的AI趋势可能会让人感到疲惫。我们从基础的AI发展到生成性AI,再到推理型AI,现在,AI代理正在主导话题。在过去的几个月里,多家科技公司纷纷推出新的AI代理,并强调连接这些代理的工作流程越来越具有吸引力。 在一月份,OpenAI发布了其首个AI代理,Operator,它能够自主地执行任务,比如根据你的喜好和标准浏览网页,预订餐厅,或者为你购买音乐会门票。 两个月后,中国AI初创公司Zhipu发布了AutoGLM Rumination,这是一个免费的AI代理,可以独立操作并为用户规划旅行。就在几天前,微软为Copilot Studio推出了“计算机使用”功能,为AI代理增加了更多自主能力,包括接管用户的桌面。 但这个趋势并不只是公司推出酷炫新产品的问题,它关乎一个复杂且不断发展的领域,该领域将各种形式的AI与人类交互相结合。科技爱好者和专家们对代理人工智能Agentic AI都表示出了强烈的乐观态度。 “我同样对AI代理人工作流这个趋势感到兴奋。”Coursera和DeepLearning联合创始人、AI专家吴恩达在11月的Snowflake的BUILD 2024会议上说,“如果你问我,最重要的AI技术是什么?我会说是Agentic AI。” 那么,AI代理究竟是什么呢?他们的表现是否如专家所说的那么好呢?以下是关于这项新兴技术最核心方面的简要概述,以及最新的发展动态。 什么是AI代理? 正如OpenAI和Microsoft等公司所展示的,AI代理是能够执行复杂任务的技术,它们自主地结合不同的应用和软件来完成任务。 从本质上讲,它们是“传统”的AI聊天机器人——但更高级,能够完成我们在过去两年中习惯的任务之外的工作。这些包括规划,浏览网页,记住你的兴趣,甚至在没有逐步指导的情况下完成你的杂货购物,因为它们能够自己解决问题。 Google Cloud将AI代理定义为“使用AI来追求目标并代表用户完成任务的软件系统。” 这些AI模型真正特别之处在于它们的高级推理能力,能够同时处理多种类型的信息——音频、文字、视频、代码和图像。它们能够像人类一样理解复杂的情况,采取行动,并与软件和平台进行交互。 许多科技公司现在都在推动他们的AI模型向这个新的水平迈进。 就在几天前,OpenAI宣布其AI模型o3和o4-mini可以“思考”图像并对它们进行操作——例如裁剪或转换它们。与此同时,微软的新功能“计算机使用”使其AI代理能够识别图形用户界面。 “如果一个人能用这个应用,那么AI代理也能用,”微软公司副总裁,业务与行业副驾驶员Charles Lamanna在公告中说。 下一级:代理AI技术 虽然许多科技公司正在开发超智能的AI聊天机器人,但代理人AI则更进一步。这项技术专注于构建多个AI代理可以互动并执行不同任务的系统,以提供更准确和更全面的结果。 在我参加的由eDreams组织的最近的一场科技讲座中,AI专家Patricia Gutierrez Faxas在她的“AI代理的力量”主题演讲中解释说,这些系统可以采取各种结构。多代理系统可以将复杂任务分解为简单的任务,将它们分配给专门的代理,并形成不同类型的网络。…