如果您一直关注最近的人工智能炒作,您一定听说过“RAG”。RAG 代表检索增强生成,这是增强人工智能聊天机器人能力的关键一步。然而,这个术语并不像“即时工程”这样的短语那么流行,可能是因为缩写通常不太直观地理解和记忆:)因此在本文中,让我们揭开检索增强生成(RAG)这一令人着迷的人工智能概念的神秘面纱。
什么是RAG?其核心是,RAG是一种方法用于人工智能以增强机器理解和生成信息的方式(https://ai.meta.com/blog/retrieval-augmented- Generation -streamlined-the-creation-of-intelligent-natural-language-processing-models/)虽然大型语言模型擅长总结和形成句子,例如自然语言中,RAG 赋予其扩展功能以提供附加信息。
假设你正在写一封信,有一个神奇的邮箱可以给你回信。这个邮箱包含人们在世界上写过的所有信件(即,它是一个大型语言模型),因此它可以根据从这些信件中学到的知识生成响应,几乎像魔术一样。这就是传统法学硕士或人工智能聊天机器人利用其“现有知识”的工作方式。
但有时,您可能想询问更具体的问题,例如蛋糕食谱、数学问题或“明天天气怎么样?”这些查询需要特定的知识或数据源,而人们可能没有在邮箱中写下这些信息 – 这就是 RAG 的用武之地。
想象一下邮箱附近有一家蛋糕店,它可以向其寻求帮助。所以,每次你提出与烘焙相关的问题时,神奇邮箱都会将这些查询发送到蛋糕店以获取相关信息。经过一番搜索后,店主指出:“您可以在我的菜谱库中找到这些有用的东西:在第 4 号和第 3 号架子上,A 行和 D 行,第 10 行和第 12 行。”这是检索部分。
然后,RAG 模型尝试生成一个类似于摘要的提示,作为信函上的“附加说明”。这是生成部分。因此,当神奇的邮箱编译所有内容时,它会同时拥有来自用户和蛋糕店的信息,而不会丢失双方的任何上下文。
这种使用检索到的信息来增强生成答案的方法就是 RAG 的全部内容。
现在您还会注意到,并非所有地方都需要 RAG。对于AI来说,RAG并不是必须具备的。在翻译、总结或完成句子时也不需要它。
为什么 RAG 很重要? RAG 就像给 AI 一个研究助理。它让人工智能能够提供更准确、更详细、更可靠的答案。例如,当使用聊天机器人时,RAG 可以帮助它提供响应,这些响应不仅基于预先提供的信息,还基于从各种来源检索到的最新、最相关的数据。
RAG的应用:
- 在客户服务中:聊天机器人可以提供更详细和最新的信息。
- 在研究中:帮助快速收集和综合信息。
- 在日常生活中:Siri 或 Alexa 等虚拟助手变得更加有用且信息丰富。
结论:RAG 是让 AI 变得更有帮助、知识更丰富、更可靠的一步。这就像为人工智能配备了一个功能强大的互联网浏览器,准备好搜索和收集信息以更有效地回答我们的问题。