基于ReAct机制的AI Agent

react,ai,agent · 浏览次数 : 0

小编点评

AI Agent(人工智能体)是一种能够模拟人类智能行为的计算实体,它可以通过语言交互来回答问题、执行任务以及与其他系统(如搜索引擎、文件系统等)互动。在大型科技公司和研究机构的推动下,AI Agent的研究和应用逐渐增多,形成了竞争激烈的市场格局。 **ReAct框架** ReAct是一个旨在辅助大型语言模型(LLM)更好地与环境互动的协作工具。在LLM与外部世界互动的过程中,ReAct可以帮助管理推理过程和探索行动策略。这个框架包含了以下几个关键组成部分: 1. **Chain of Thought(思维链)**:这是一个将复杂任务分解成一系列可逐步处理的子任务的机制。 2. **Observation(观察)**:在行动后,ReAct会对环境做出响应并收集反馈数据,为后续推理和行动提供信息。 3. **Reasoning(推理)**:在获取新信息或数据后,LLM(语言模型)将使用推理能力来分析并根据这些信息做出决策。 4. **Action(行动)**:基于推理的结果选择适当的动作,如查询信息、执行程序或其他自定义任务。 **LangChain中的ReAct机制实现AI Agent** 在LangChain中集成ReAct机制能让AI Agent更加灵活地利用LLM来解决现实世界中的问题。以下是LangChain中ReAct机制如何工作的简述以及如何实现: 通过定义一个工具集合并配置工具,让LLM可以利用这些工具完成特定任务。例如,在上述例子中,`SumNumberTool`能够执行数字相加的操作。 ```python from langchain import hub from langchain.agents import create_structured_chat Agent, AgentExecutor from langchain.memory import ConversationBufferMemory from langchain.schema import HumanMessage # 定义一个工具,例如:数字相加计算工具 class SumNumberTool(BaseTool): def _run(self, a, b): return a + b # 创建一个新的AI Agent实例(这里我们使用了LangChain的ChatAgent,但也支持其他类型) def create_react_ai_agent(): model = ChatOpenAI("gpt-3.5-turbo", openai_api_key="your_api_key") tools = [SumNumberTool()] prompt = hub_PULL("hwchase17/structured-chat-agent") agent = create_structured_chat_agent( model, tools=tools, prompt=prompt ) return agent # 使用AgentExecutor来执行定义好的工具 def main(): agent = create_react_ai_agent() # 测试使用react工具 result = agent.executor({ "input": "请帮我在3.941592623412424和4.3434532535353之间做加法"}) # 测试不用react工具的情况 result_without_react = model.invoke({ "input": "请帮助我计算3.941592623412424加4.3434532535353"}) if __name__ == "__main__": main() ``` 通过这种设计,开发者可以创建一个适应不同场景的更智能的AI Agent。ReAct提供了一种引导LLM进行推理和行动的方法,以优化其性能和应用范围。

正文

当前,在各个大厂纷纷卷LLM的情况下,各自都借助自己的LLM推出了自己的AI Agent,比如字节的Coze,百度的千帆等,还有开源的Dify。

你是否想知道其中的原理?是否想过自己如何实现一套AI Agent?当然,借助LangChain就可以。

1. 简述AI Agent

何为AI Agent呢?如果拿人来对比的话,半支烟认为AI Agent就是一个会思考和行动的人,其中LLM就是这个人的大脑。

说白了,AI Agent就是借助LLM这个大脑,加上一些 能够感知外部环节 和 能够发起行动 的部件,共同组成的一个 机器人。

那怎样能够让 AI Agent这个机器人,充分利用LLM 和 各种部件呢?那ReAct就是这个协作工具。利用ReAct机制,LLM可以很好的结合外部环境和行动组件,形成一个完整的AI Agent。

下面将探讨ReAct框架的概念、原理、优势,并通过代码示例展示如何在LangChain中使用ReAct构建AI Agent。

2. ReAct概念和原理

2.1 为什么需要ReAct

我们知道,LLM在训练完毕后,会具备较强的推理能力,但是他的知识随着时间的推移会过时,但是又不可能经常性的去训练LLM,毕竟每次训练的成本太高了。

那怎么解决这个问题?机器可以像人一样自己主动去学习和搜索新知识呀。

那机器怎么知道什么时候该去搜索知识?什么时候时候该去调用什么样的工具解决当前的问题呢?

ReAct应运而生。ReAct的核心在于,推理和行动。

2.2 ReAct的定义

ReAct(Reasoning and Action)是一个框架,其概念来源于一篇论文,其核心思想,就是通过思维链的方式,引导模型将复杂问题进行拆分,一步一步地进行推理(Reasoning)和行动(Action),同时还引入了观察(Observation)环节,在每次执行(Action)之后,都会先观察(Observation)当前现状,然后再进行下一步的推理(Reason)。

ReAct这个框架,就是要让LLM,进行推理,然后采取行动与外界环境互动。

ReAct这个框架,就是要让开发者一步步引导LLM进行推理,然后根据推理的结果,判断采取哪个行动。

2.3 ReAct的核心组件

ReAct框架的核心组件包括:

  • 思维链(Chain of Thought):将一个大的复杂任务进行拆解,拆解成多个思维步骤。
  • 推理(Reasoning):负责分析和处理输入的数据,生成有效的决策。
  • 行动(Action):执行具体的操作,比如搜索、执行代码,或者其余自定义的行动。
  • 观察(Observation):监控和收集环境反馈的数据,为下一步的推理和行动提供依据。

2.4 工作流程

ReAct框架的工作流程如下:

  1. 输入数据:接收用户输入或环境数据。
  2. 推理阶段:分析输入数据,生成决策和计划。
  3. 行动阶段:根据决策执行具体操作。
  4. 观察阶段:监控操作结果,收集反馈数据。
  5. 循环迭代:根据反馈数据调整推理和行动,持续优化结果。

2.5 举个例子说明ReAct步骤

比如,要知道2024年周杰伦最新的演唱会是时间和地点是什么,通过ReAct机制,会被拆解成以下步骤:

推理1:用户想知道2024年周杰伦最新的演唱会是时间和地点是什么,需要查找最新的信息。
行动1:调用Google的搜索API进行搜索。
观察1:搜索结束,搜索的结果中出现一些关于《2024年周杰伦最新的演唱会》的网页信息。

推理2:搜索出来的网页较多,大概浏览前6个网页的具体内容。
行动2:点击第一个网页,开始浏览。
观察2:浏览结束,浏览的网页内容提及到了2024年周杰伦最新的演唱会信息。

推理3:针对网页的内容进行,问题的总结。
结果:将最终的答案输出给用户。

3. LangChain的ReAct机制实现AI Agent

以上我们已经了解的原理和步骤,接下来我们使用LangChain定义一个ReAct机制的AI Agent。

3.1 示例

比如,在不使用ReAct机制借助外部工具的情况下,让LLM帮我们计算两个小数相加,则直接出错。

然后,借助ReAct机制,会让LLM自动使用自定义工具,最终计算正确。

然后,继续测试,问别的问题,借助ReAct机制,则不会使用到工具,直接给出答案。

3.2 代码

具体代码如下:

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.schema import HumanMessage
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI

# 模型
model = ChatOpenAI(model="gpt-3.5-turbo",
                   openai_api_key="sk-XXXXXXXXXX",
                   openai_api_base="https://api.aigc369.com/v1")
# 直接让模型计算数字,模型会算错
model.invoke([HumanMessage(content="你帮我算下,3.941592623412424+4.3434532535353的结果")])


# 下面开始使用ReAct机制,定义工具,让LLM使用工具做专业的事情。

# 定义工具,要继承自LangChain的BaseTool
class SumNumberTool(BaseTool):
    name = "数字相加计算工具"
    description = "当你被要求计算2个数字相加时,使用此工具"

    def _run(self, a, b):
        return a.value + b.value
        
# 工具合集
tools = [SumNumberTool()]
# 提示词,直接从langchain hub上下载,因为写这个ReAct机制的prompt比较复杂,直接用现成的。
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(
    llm=model,
    tools=tools,
    prompt=prompt
)
# 使用Memory记录上下文
memory = ConversationBufferMemory(
    memory_key='chat_history',
    return_messages=True
)
# 定义AgentExecutor,必须使用AgentExecutor,才能执行代理定义的工具
agent_executor = AgentExecutor.from_agent_and_tools(
    agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)
# 测试使用到工具的场景
agent_executor.invoke({"input": "你帮我算下3.941592623412424+4.3434532535353的结果"})

# 测试不使用工具的场景
agent_executor.invoke({"input": "请你充当稿件审核师,帮我看看'''号里的内容有没有错别字,如果有的话帮我纠正下。'''今天班级里的学生和老实要去哪里玩'''"})        


4. 总结

本文主要介绍了AI Agent的概念,探讨了ReAct框架的概念、原理、优势,并通过代码示例展示如何在LangChain中使用ReAct构建AI Agent。希望对你有帮助!

======>>>>>> 关于我 <<<<<<======

本篇完结!欢迎点赞 关注 收藏!!!

原文链接:https://mp.weixin.qq.com/s/OAQ3nPeRaC7mSNFNFDqF_A

与基于ReAct机制的AI Agent相似的内容:

基于ReAct机制的AI Agent

当前,在各个大厂纷纷卷LLM的情况下,各自都借助自己的LLM推出了自己的AI Agent,比如字节的Coze,百度的千帆等,还有开源的Dify。你是否想知道其中的原理?是否想过自己如何实现一套AI Agent?当然,借助LangChain就可以。

基于React的SSG静态站点渲染方案

基于React的SSG静态站点渲染方案 静态站点生成SSG - Static Site Generation是一种在构建时生成静态HTML等文件资源的方法,其可以完全不需要服务端的运行,通过预先生成静态文件,实现快速的内容加载和高度的安全性。由于其生成的是纯静态资源,便可以利用CDN等方案以更低的成

vue的两种服务器端渲染方案

关于服务器端渲染方案,之前只接触了基于react的Next.js,最近业务开发vue用的比较多,所以调研了一下vue的服务器端渲染方案。本文着重介绍两种渲染方案。

一个.NET 7 + DDD + CQRS +React+Vite的实战项目

## 项目简介 基于SignalR实现聊天通信,支持横向扩展,可支撑上万用户同时在线聊天 ## 快速体验 http://server.tokengo.top:8888/ 可在这里快速体验使用,请注意目前只适配了PC端,请勿使用手机访问,可能出现样式不适应的情况, 当然如果你想要自己部署也可以,目前提

DHorse v1.2.1 发布,基于k8s的发布平台

# 综述 DHorse是一个简单易用、以应用为中心的云原生DevOps系统,具有持续集成、持续部署、微服务治理等功能,无需安装依赖Docker、Maven、Node等环境即可发布Java、Vue、React应用,主要特点:部署简单、操作简洁、功能快速。 # 优化内容 * 优化jvm指标收集时dhor

DHorse v1.3.0 发布,基于k8s的发布平台

# 综述 DHorse是一个简单易用、以应用为中心的云原生DevOps系统,具有持续集成、持续部署、微服务治理等功能,无需安装依赖Docker、Maven、Node等环境即可发布Java、Vue、React应用,主要特点:部署简单、操作简洁、功能快速。 # 新增特性 * 增加prometheus的配

DHorse v1.4.0 发布,基于 k8s 的发布平台

版本说明 新增特性 提供Fabric8客户端操作k8s(预览)的功能,可以通过指定-Dkubernetes-client=fabric8参数开启; Vue、React应用增加Pnpm、Yarn的构建方式; 支持Go、Flask、Django、Nuxt应用部署; 优化特性 副本指标数据保存为3天; 部

如何创建一个浏览器版的`Window11`

如何创建一个浏览器版的Window11 我们接下来将创建一个在浏览器运行的Window11,可以先看看效果图 这是基于Windows 11 in React修改的功能,我们接下来就将使用Windows 11 in React来创建我们的浏览器的Window11 通过Git拉取源码 git clone

带你揭开神秘的javascript AST面纱之AST 基础与功能

在前端里面有一个很重要的概念,也是最原子化的内容,就是 AST ,几乎所有的框架,都是基于 AST 进行改造运行,比如:React / Vue /Taro 等等。 多端的运行使用,都离不开 AST 这个概念。在大家理解相关原理和背景后,我们可以通过手写简单的编译器,简单实现一个 Javascript 的代码编译器,编译后在浏览器端正常运行。

[react性能优化]--防止react-re-render: Why Suspense and how ?

近期内部项目基础项目依赖升级,之前使用的路由缓存不再适用,需要一个适配方案。而在此过程中react re-render算是困扰了笔者很久。后来通过多方资料查找使用了freeze解决了此问题。本文主要论述react re-render问题一般的解决方案和freeze在react内部的实现原理。reac