AI Agents在硅谷大佬之间是否真的很热门,还是只是一种短暂的激情?

'AI Agents在硅谷是否真的很热门,还是只是一时的热情?'

AI Agents:数字助理的崛起

“AI Agents注定是一场马拉松。” –OpenAI联合创始人,前TeslaAI总监Andrej KarLianGuaithy

ChatGPT的成功后,OpenAI已经将目光转向了下一个目标:AI Agents(智能体)。Andrej KarLianGuaithy表示,相比于OpenAI这样的公司,普通人、创业者和极客在构建AI Agents方面更具优势。他的言论引起了广泛关注,并得到了很多人的认同。

早在3月份,AutoGPT在GitHub上迅速获得了7.4万颗星,成为历史上增长最快的开源项目。之后,BabyAGI、AgentGPT等又相继问世,它们可以订购披萨、整理邮箱、创建博客,甚至举办一场情人节派对,AI Agents的应用范围不断扩大。越来越多的AI Agents开始浸入人们的生活,AI Agents的热潮迅速蔓延开来。

AI Agents被寄予了极高的期望,被认为是“改变社会生产力的工具”和“通往通用人工智能时代的开始”。然而,尽管呼声不断,AI Agents所面临的问题仍然不可忽视。

市面上只有ChatGPT一个“合格”的大模型底座,国内缺乏AI Agents的开发土壤。AI Agents的发展离不开足够强大的硬件基础。然而,现实是残酷的,技术研发和创业投资也不断摇摆不定。AI Agents红利期究竟何时到来,目前还无法预知,但变革已经悄然开始。

1. AI Agents:帮你做事的“数字助理”

不要将AI Agents看作是ChatGPT的升级版,将其视作人类的“数字助理”更为贴切。AI Agents不仅能告诉你“如何做”,还能“帮你做”。它作为一种媒介,代替人类与大型语言模型(Large Language Model, LLM)如GPT进行交互。只要给定目标,AI Agents就能模拟智能行为,自主创建任务、确定任务列表优先级、完成首要任务,并循环直到目标达成。

与传统的人工智能不同,AI Agents可以在没有人类控制的情况下独立运行。通过接入API,AI Agents甚至可以浏览网页、使用应用程序、读写文件、使用信用卡付款等。简而言之,只需要给AI Agents一个目标,它就能完成剩下的全部工作。例如,HyperWrite研发的AI Agent可以通过Chrome浏览器控制程序自动帮你订购披萨。

这种想象放在科幻电影中并不难,但在人工智能探索的历程中,已经持续了将近半个世纪。早在20世纪80年代,计算机科学家就开始探索如何开发一个可以像人类一样交互的智能软件。但由于数据和计算能力的限制,AI Agents缺乏必要的现实条件。

大模型是AI Agents的前提,只有在具备足够强大的硬件基础之后,AI Agents的发展才能跨越瓶颈。目前市面上只有ChatGPT一个“合格”的大模型底座,国内在AI Agents的开发方面仍然存在着很大的空白。

2. 接替LLM,AI Agents成为下一个AI热点

ChatGPT与Copilot的推出,使得AI具备了与人类进行多轮对话并提供信息和建议的功能,能够承担为人类完成工作初稿的能力。AI Agents的出现,不再需要为AI的每一步行动提供具体清晰的指示。

AI Agents可以完成各种任务,无论是撰写文案、回答问题,还是生成真假难辨的照片。然而,目前人们通常需要为AI的每一步行动提供明确的指示,就像教导实习生一样。但如果你希望拥有一个能够独立解决困难、尽量不给人添麻烦的好员工呢?

在过去的几个月中,AI Agents集中爆发。AutoGPT在GitHub上获得了超过14万颗星,成为历史上增长最快的开源项目之一。OpenAI联合创始人兼CEO Sam Altman表示,构建庞大AI模型的时代已经结束,智能体才是挑战。

AI Agents的潜力得到了业界、学术界和投资界的广泛关注和期待,有人甚至将其称为“原始AGI”。AI Agents似乎正在接替大模型成为AI的下一个热点。

然而,与此同时,也有人对其提出了质疑。图灵奖得主Yoshua Bengio在他的博文中提到,人类能够控制AI Agents的总任务和总目标,并不意味着人类能够控制AI Agents通过自身智慧分解出来的子任务和子目标。除非取得AI对齐的突破,否则人类就没有强有力的安全保障。

AI Agents的兴起激起了大佬们的关注和质疑,AI Agents的浪潮迅速甚至火热地席卷而来。

AI Agents并非一个新名词。早在2014年,DeepMind推出的围棋AI AlphaGo就是AI Agents的一种。类似的还有2017年OpenAI推出的用于玩Dota2的OpenAI Five,以及2019年DeepMind公布的用于玩星际争霸2的AlphaStar。这些应用主要集中于游戏领域,特别是一些对抗性、有明显输赢双方的比赛中。然而,要在真实世界中实现通用性,仍然是一个未决的问题。

随后几年,OpenAI转向了大语言模型,推出了GPT系列。大模型成为各大科技公司竞相涌入的领域,它为AI Agents提供了突破瓶颈、重新发展的契机。

相较于几年前局限于游戏场景,AI Agents在大模型的基础上可以实现更多可能性。AI Agents的应用生态将变得多样化,对传统应用有可能产生颠覆性的影响。在每个具体的任务中,AI Agents都有大量的优化空间,包括特定算法和服务的构建,用户数据和产品设计等方面,这为初创公司提供了开拓新领域的机会。

尚未确定的生态,还未制定规则的赛场,让所有人又回到了同一起跑线上。

然而,要实现可用的AI Agents,仍需要提高大模型的能力,即使对于OpenAI这样处于顶层的公司来说,在延迟和性能方面仍有很大的提升空间。AI Agents的应用并没有真正的产品出现,只有许多演示。

AI Agents的发展注定是一场长跑马拉松。AI Agents赛道的发令枪已经打响,但前方的路还很长远。