GenAI只是开始,接下来是AI Agent。
当吴恩达(Andrew Ng)、安德烈·卡帕蒂(Andrej Karpathy)发言时,我们应该倾听!简单的。
这篇文章是关于什么的?
人工智能的未来将是代理式的!在本文中,我们将介绍这意味着什么。了解人工智能领域最优秀的人才如何谈论人工智能代理。
本文旨在探讨人工智能 (AI) 代理的概念及其在塑造未来方面日益增长的重要性。
我希望读者能够全面了解人工智能代理、其核心功能及其广泛的应用。在下一部分中我们将构建它!
为什么要读它?
您一定不想错过这个——工作的未来正在改变。
人工智能领域正在超越狭隘的专业模型,转向开发能力强的自主代理,这些代理可以真正在广泛的领域增强和增强人类智能。这种向人工智能代理的转变有望深刻改变我们的工作、生活以及与技术交互的方式,开创智能、自适应和日益有用的人工智能系统的新时代。
阅读本文,了解为什么整个人工智能领域都倾向于开发先进的人工智能代理,这可能会彻底改变我们处理和利用人工智能的方式。
无论您是经验丰富的人工智能爱好者还是该领域的新手,了解人工智能代理的发展轨迹对于及时了解情况并积极参与未来的变革之旅至关重要。
如果您想要以下内容,那么这篇文章是必读的:
- 了解工作的未来:人工智能代理将如何重塑行业和你自己的职业生涯?
- 成为早期采用者:了解如何创建人工智能代理并利用它们的力量。
- 获得竞争优势:在快速发展的技术领域保持领先地位。
当我们拥有 LLM 和 RAG 时,为什么还需要 AI Agent?
虽然法学硕士和 RAG 模型已经突破了语言生成的可能性界限,但人工智能代理的开发代表了朝着更智能、自主和多功能系统迈出的一步,这些系统可以在更广泛的场景中与人类一起工作。向代理的转变是为了创建能够真正理解、学习和解决现实世界中的问题的人工智能系统。
需要人工智能代理有几个关键原因。
- 面向目标的行为:LLM 和 RAG 模型主要专注于根据训练数据中的模式生成类似人类的文本。然而,他们缺乏以灵活、明智的方式设定和追求特定目标的能力。另一方面,人工智能代理可以被设计为具有明确的目标,并计划和采取行动来实现这些目标。另一方面,人工智能代理可以被设计为具有明确的目标,并计划和采取行动来实现这些目标。
- 内存和状态跟踪:当前大多数语言模型没有持久内存或状态跟踪功能。每个输入都是独立处理的。人工智能代理可以维持内部状态,随着时间的推移积累知识,并利用该状态为未来的决策和行动提供信息。
- 与环境的交互:法学硕士仅在文本领域运作,与物理世界没有任何直接交互。人工智能代理可以感知环境并对其采取行动,无论是数字世界、机器人系统,还是通过传感器和执行器的物理世界。
- 迁移和泛化:虽然法学硕士擅长类似于训练数据的语言任务,但他们常常难以将知识迁移到全新的领域或任务。人工智能代理具有学习、推理和计划的能力,有可能更好地迁移和泛化到新的情况。
- 持续学习:大多数语言模型经过训练后都是静态的。随着时间的推移,人工智能代理可以在与新环境和情况交互时不断学习和调整他们的知识和技能。
- 多任务能力:法学硕士通常专门针对特定的语言任务。人工智能代理可以被设计为通用的多任务系统,能够流畅地结合语言、推理、感知和控制等各种技能来解决复杂的多方面问题。
“AI智能体”将如何改变世界?
假设您需要预订一次复杂的旅行:
法学硕士:可以解释不同的游览地点或提供一般旅行提示。
RAG:可以找到有关目的地的相关博客和文章
人工智能代理:可以做到这一切,另外:
- 根据您的预算搜索航班和酒店
- 进行预订
- 将所有内容添加到您的日历中
- 发送包含相关信息的出发前提醒
让我们清楚地了解LLM、RAG和AI Agent
1. 任务导向与常识
- 法学硕士:擅长广泛的语言理解和生成。它们就像巨大的信息图书馆。
- RAG:通过查找相关信息来提高法学硕士。尽管如此,重点仍然是知识和文本生成。
- 人工智能代理:是根据特定目标而构建的。它们弥合了理解语言与在现实世界或数字系统中采取行动之间的差距。
2. 多步推理
- LLM 和 RAG:主要研究单一输入并据此提供响应。
- AI 代理:可以将多个步骤链接在一起:
- 检索信息(如 RAG)
- 处理信息以做出决策
- 采取以下行动:
- 发送电子邮件
- 预约
- 控制智能家居设备
3、积极主动
- LLM 和 RAG:通常响应直接提示。
- AI代理:可以积极主动。他们能:
- 监控数据流并提醒您重大变化
- 根据您的偏好启动操作
- 随着时间的推移,他们了解您后会调整他们的行为
4. 与现有系统集成
- LLM 和 RAG:倾向于在自己的环境中运作。
- AI 代理:旨在与各种系统和 API 进行交互:
- 访问您的电子邮件或日历
- 与数据库交互
- 控制其他软件或设备
AI 代理的架构需要什么?
人工智能代理的架构包含使其能够在其环境中思考、计划和行动的基本组件。这种复杂的设计通常包括:
- 推理引擎:代理的核心,利用强大的大型语言模型 (LLM) 来理解自然语言、获取知识并推理复杂问题。
- 知识库:充当代理的记忆库,存储与其任务相关的事实信息、过去的经验和偏好。
- 工具集成:允许代理通过 API 与各种软件应用程序和服务交互,扩展其操纵和控制其环境的能力。
- 感官输入:为代理提供感知周围环境、从文本、图像或各种传感器收集数据的能力。
- (可能是)用户界面:实现与人类用户无缝通信和协作的桥梁。 ( ** 我不太确定是否有任何标准的用户体验,但我相信我们很快就会需要,或者可能还不是很标准)
这些元素共同创建了一个可以自主解决问题的智能系统。人工智能代理可以分析问题、制定分步计划并自信地执行它,使其成为人工智能世界的变革力量。