- 大模型项目实战:Agent开发与应用
- 高强文
- 824字
- 2025-05-07 11:54:58
1.1 Agent的概念
在人工智能语境下,Agent是AI Agent的简写。Agent的概念与人工智能、主动服务于人类的软件、大语言模型等有关。
亚马逊的AWS云服务网站中的Agent定义为:AI Agent是一种软件程序,它可以与环境互动,收集数据,并利用数据执行自主任务,以实现人类预定的目标。AI Agent会独立选择实现这些目标所需的最佳行动[1]。
IBM对Agent的定义则突出了其自主性和扩展性,将Agent定义成能够通过设计工作流程和利用可用工具,代表用户或其他系统自主执行任务的系统或程序。AI Agent可以包含自然语言处理之外的广泛功能,包括决策、解决问题、与外部环境交互和执行操作[2]。
Microsoft则着重强调了Agent的使用场景和功能:Agent为用户执行特定任务、回答问题并自动执行流程,具有较高的复杂性而且功能差异很大,从简单的聊天机器人到Copilot[3],再到数字人或机器人系统形式的高级人工智能助手,可以自主运行复杂的工作流程[4]。Microsoft还阐述了Agent与大语言模型或基于规则的软硬件之间在自主性方面的重要区别,也明确了Agent具备规划(Planning)、工具使用(Tool usage)、感知(Perception)和记忆(Memory)等功能。
综合以上信息,笔者对Agent的定义总结如下:Agent(AI Agent)是一种人工智能应用,通过自主规划、工具调用、感知和记忆等功能,在大语言模型的支持下,代表或代理人类,自主决策,主动解决用户提出的任务。
Agent的中文翻译是“代理”,代理这个词指代的职业、职位比较宽泛,有些图书或文章将AI Agent直译成“人工智能代理”,其主动性被弱化了。如果翻译成“助理”(Assistant),则会把Agent的应用场景缩小很多。目前比较通行的翻译是“智能体”,虽然未能表达出Agent代表人类的特点,但是说明了Agent是一个具有智能的独立个体,有一定的主动性。笔者的想法是将智能体简化为“智体”,智体与智能体表达的意思没有区别,但更有科技感和画面感。
在本书中,Agent、AI Agent、智体三者代表的是同一个概念,在不同的语境中使用不同的说法:AI Agent会出现在相对专业的描述中;Agent是AI Agent的简略表示,因为本书整体与人工智能有关,所以使用Agent也没有歧义;在通俗化表达或描述应用场景时,使用智体则显得行文流畅。