大佬都在讲的AI Agent,是什么?

慧聪通信网 2024-07-23 09:15 来源:通信世界全媒体

【慧聪通信网】在最近的展会上,小编听到了很多行业大佬在讲“AI Agent”。

一般附在大模型的后面,介绍的篇幅甚至要比大模型更长更详细。

那么,备受推崇的AI Agent究竟是什么,与目前的大模型有什么区别呢?

按百度百科来讲,AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。

意思就是,相比于大模型,AI Agent“会使用工具”。

如果说人与动物的区别是人类会使用工具,那么AI Agent与大模型的区别亦然。

因为当前的LLM(大语言模型),无论是国外的ChatGPT还是国内的文心一言、Kimi智能助手等,都是对话式,都是按照用户提问-回答-再提问-再回答(如此循环)来实现。

那么,问题就来了,这些大模型输出的内容常取决于用户的提问能力,如果提问不够精确、不够全面,是不是就得不到满意的效果?

因此,现在网上甚至出现一些“大模型提示词怎么写?”“AI大模型或重塑职场!'会提问'将成制胜新技能”等言论。

就连我们编辑部的设计师同事也曾吐槽过,虽然大模型出一张图很快,但如何让它设计出满意的图,却比自己完成花的时间更久。

由此可见,当前人工智能方面的重要矛盾是人们对大模型日益增长的需要与大模型提问模式不平衡不充分的发展之间的矛盾。‌

而且,随着AI的不断迭代,如今很多算法已经实现了自主学习、调用工具的能力,因此,AI Agent应运而生。

AI Agent的起源、定义

在查阅Agent的论文时,我发现其中很大一部分是关于哲学方面的表述。

甚至最早要追溯到”道生一,一生二,二 生三,三生万物”可以自我演进的春秋时期(公元前450年)和“拥有欲望、信念、意图和采取行动能力的实体”的亚里士多德时期(公元前350年)。

足以见得,人类对于人工智能甚至说演进的研究保持了一如既往的热爱。

而当代Agent的起源,则莫过于图灵测试。20 世纪 50 年代,阿兰图灵(Alan Turing)把“高度智能有机体”概念扩展到了人工实体,并提出了著名的图灵测试。即测试者写下自己的问题,随后将问题以纯文本的形式(如计算机屏幕和键盘)发送给另一个房间中的一个人与一台机器。测试者根据他们的回答来判断哪一个是真人,哪一个是机器。

随着人工智能的发展,如今的“高度智能有机体”逐渐得到共识:用来描述显示智能行为并具有自主性、反应性、主动性和社 交能力等素质的实体——AI Agent。

同时,自图灵测试后,人工智能经历了上世纪60年代电影等文艺作品的涌现、1997年深蓝击败人类国际象棋冠军、2011年苹果发布Siri、2012年AlexNet 卷积神经网络的深度学习模型取得“ImageNet 计算机视觉挑战赛”第一名、2016年AlphaGO击败世界围棋冠军李在石等光辉时刻。

终于在2022年末,随着ChatGPT发布5天,用户数突破100万人,人工智能凭借大模型再一次肩负起了能给世界带来革命性改变的重托。

紧接着,在2023年4月,OpenAI发布了AutoGPT。

与ChatGPT不同的是,用户不需要不断对 AI 提问以获得对应回答,在 AutoGPT 中只需为其提供一个 AI 名称、描述和五个目标,AutoGPT 就可以自己完成项目。它可以读写文件、浏览网页、审查自己提示的结果,以及将其与所说的提示历史记录相结合。

如果说这还没有让大家感到重视。那么2023年6 月底,OpenAI Safety 团队负责人翁丽莲在自己的博客上发表的一篇名为 LLM Powered Autonomous Agents 的文章足以让大家对Agent有了更多了解。文中,翁丽莲详细介绍了基于LLM的AI Agent,并直言:AI Agent将是使LLM转为通用问题解决方案的途径之一。

一时间,AI Agent成为继LLM之后的又一热门话题,如今提及AI Agent,创业者们就会双眼放光,投资人们也是热情高涨,大企业们更是跃跃欲试。

在2024世界互联网大会上,中国工程院院士邬贺铨就曾言,AI Agent是大模型落地载体的关键作用。他认为,国内外科技巨头纷纷布局智能体领域,搭建各自的智能体开发平台,以推动AI技术的广泛应用与商业化进程。

同时,在“2024 WAIC”上,百度创始人、董事长兼首席执行官李彦宏就也公开表示:“Agent是我们最看好的AI应用发展方向。”

此外,比尔盖茨、吴恩达、李飞飞等均多次表示AI Agent是重要发展方向。

Agent爆发前夜

大厂都在“卷”什么?

Agent有着如此重要的行业前景,自然,国内外大厂都在精心布局,但从实际效果来说,究竟是真的具有自主性、独立性,还是在原有人工智能的基础上扣一个Agent的外壳,走“换汤不换药”那一套,也具有极强的迷惑性。

国际视角

作为AI领域的先锋,Open AI不仅早在2023年4月推出推出 Plugin(插件),希望用户可以轻松在Plugin平台下开发应用插件,并且在OpenAI首届开发者大会(OpenAI DevDay)上,OpenAI发布了AI Agent初期形态产品GPTs,推出了相应的制作工具GPT Builder。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。

然而,目前OpenAI打造的GPT商店(即GPTs)却因只能让ChatGPT Plus 付费会员使用,受益面较窄,因此一时间无法达成“复刻App Store辉煌”的目标。

微软在AI Agent的布局上同样不遗余力。2023年3月Microsoft 365 Copilot发布,在当时便提出了一种基于LLM的应用开发范式,即Agent。2024年5月22日,微软在一年一度的Build开发者大会正式推出Team Copilot,将Copilot for Microsoft 365从幕后的个人AI助手,扩展为团队助手。

在toB方面,IBM提出基于深厚技术与客户基础,实现Agent和智能体平台的组合布局,推出企业级AI与数据平台——watsonx平台。在7月9日的IBM Think大会上,IBM宣布了watsonx平台的新更新和新推出的数据与自动化功能,称使人工智能对企业而言更具开放性、成本效益与灵活性。

国内视角

在国内,AI Agent的发展同样如火如荼。2024年,中国“玩家”与时俱进,在2024年元年论被“说烂了”的基础上,提出了“2024年是AI Agent的发展元年”一说。

不仅大厂中,字节跳动的扣子、腾讯云的腾讯元器、百度智能云千帆AgentBuilder、阿里云大模型平台百炼、科大讯飞星火智能体平台、华为方舟实验室的盘古智能体框架(Pangu-智能体)等纷纷“出手”,同时包括智谱AI、面壁智能等大模型创业公司,容联云、思迈特等SaaS公司,钉钉、飞书等协同办公赛道企业等也都在“加码”。

但该说不说,Agent仍然是国内被认可的人工智能应用落地的最重要的产品形态。

依照OSI参考模型,有媒体将当前中国AI Agent生态分为算力层(泛AI算力)、平台框架层(企业级AI Agent平台和开发者AI Agent平台/框架)和垂直应用层三层。

其中,在算力基础设施层面,阿里云、百度智能云、华为云等领军企业凭借卓越的计算资源调配能力与庞大的数据存储容量,构筑了AI技术发展的坚实基础。

平台框架层作为连接底层算力与上层应用的“桥梁”,可细化为两大核心方向:一是企业级AI Agent平台,以钉钉、实在智能等企业为代表,通过整合先进的人工智能技术与敏锐的行业洞察,为企业用户打造智能化、自动化的业务流程,显著提升运营效率与决策精准度。二是AI Agent开发平台,如星火智能体开发平台、文心智能体平台等,致力于为广大开发者提供开放、灵活的开发环境。

垂直应用层则是AI生态体系中直接面向终端用户的“前沿阵地”,涵盖了金融、招聘、营销、供应链、教育、数据分析、AI PC等众多领域。

但从目前来看,由于Agent的重要性,一些大厂甚至在各个层面都有布局,形成“大厂要生态、小厂要聚焦”的场景。

结语

数据显示,全球数据量将在未来5年保持持续增长,2022年,全球数据规模已达到103ZB,中国数据规模达到23.9ZB;预计2027年,全球数据规模可达到284.3ZB,2022-2027的复合增长率可达到22%,而中国数据量规模则可达到76.6ZB。

在这样的数据规模下,人工智能的应用边界似乎只受限于人类的想象力,可谓是“只有你想不到,没有我办不到”。

但也必须清醒认识,AI Agent的演进并非旨在取代人类,而是在拓展人类发展的边界,为人类社会注入前所未有的可能性。AI将逐步转型为工作中的得力伙伴,以其不知疲倦的探索精神和永恒的好奇心,成为人类智慧的重要补充。

而AI Agent也终将是一位助手,而已。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。