LangChain让LLM带上记忆

langchain,llm · 浏览次数 : 0

小编点评

### 文章概述在过去的两年里，“百模大战”让我们看到了大型语言模型（LLM）的强大之处，但在实际应用中，LLM却常常因缺乏记忆功能而让用户感到困扰。本文将探讨如何利用LangChain，轻松地为LLM添加记忆功能，从而提升对话体验。 ### LLM的局限性 LLM以其卓越的智能性和自然语言理解能力而闻名，但在对话系统中，其缺乏记忆功能成为一个明显的短板。这意味着在同一对话中，LLM无法记住前后的上下文信息，导致对话流畅性受到影响。 ### 记忆组件的原理为了解决LLM的记忆问题，通常的做法是将历史对话信息重新输入到LLM中。例如，可以通过对每次对话进行截屏或录屏，并将这些内容作为新的输入，重新交给LLM进行处理。然而，这种方法在实际操作中并不便捷，需要人工不断地更新历史对话信息。 LangChain的出现为LLM的记忆问题提供了一种更高效的解决方案。LangChain对记忆组件进行了高度封装，使得开发者可以方便地为其添加记忆功能。 ### LangChain实现记忆功能的方法 #### 单独使用ConversationBufferMemory进行短期记忆 LangChain提供了ConversationBufferMemory类，专门用于存储和管理对话信息。通过将对话内容存储到input变量中，我们可以实现短期记忆功能。 #### 利用MessagesPlaceholder手动添加历史 LangChain还提供了MessagesPlaceholder占位符，用于在对话模板中动态插入历史信息。通过这种方式，我们可以方便地将历史信息添加到对话中。 #### 利用ConversationChain自动添加历史 ConvenciónChain是LangChain提供的一个强大的对话链工具，它可以自动将对话中的历史信息添加到LLM中。通过设置return_messages=True参数，我们可以轻松地实现短期记忆功能。 #### 结合PromptTemplate和MessagesPlaceholder使用通过结合PromptTemplate和Messages_placeholder，我们可以在ChatPromptTemplate中动态添加上下文信息，从而引导LLM生成更加准确和相关的回复。 ### 结论本文介绍了LLM缺乏记忆功能的固有缺陷，并探讨了记忆组件的原理。通过利用LangChain提供的灵活内存组件工具，我们可以轻松地为LLM添加记忆功能，使其在对话中能够更好地保持上下文信息。这对于改善用户体验具有重要意义。

正文

最近两年，我们见识了“百模大战”，领略到了大型语言模型（LLM）的风采，但它们也存在一个显著的缺陷：没有记忆。

在对话中，无法记住上下文的 LLM 常常会让用户感到困扰。本文探讨如何利用 LangChain，快速为 LLM 添加记忆能力，提升对话体验。

LangChain 是 LLM 应用开发领域的最大社区和最重要的框架。

1. LLM 固有缺陷，没有记忆

当前的 LLM 非常智能，在理解和生成自然语言方面表现优异，但是有一个显著的缺陷：没有记忆。

LLM 的本质是基于统计和概率来生成文本，对于每次请求，它们都将上下文视为独立事件。这意味着当你与 LLM 进行对话时，它不会记住你之前说过的话，这就导致了 LLM 有时表现得不够智能。

这种“无记忆”属性使得 LLM 无法在长期对话中有效跟踪上下文，也无法积累历史信息。比如，当你在聊天过程中提到一个人名，后续再次提及该人时，LLM 可能会忘记你之前的描述。

本着发现问题解决问题的原则，既然没有记忆，那就给 LLM 装上记忆吧。

2. 记忆组件的原理

2.1. 没有记忆的烦恼

当我们与 LLM 聊天时，它们无法记住上下文信息，比如下图的示例：

2.2. 原理

如果将已有信息放入到 memory 中，每次跟 LLM 对话时，把已有的信息丢给 LLM，那么 LLM 就能够正确回答，见如下示例：

目前业内解决 LLM 记忆问题就是采用了类似上图的方案，即：将每次的对话记录再次丢入到 Prompt 里，这样 LLM 每次对话时，就拥有了之前的历史对话信息。

但如果每次对话，都需要自己手动将本次对话信息继续加入到history信息中，那未免太繁琐。有没有轻松一些的方式呢？有，LangChain！LangChain 对记忆组件做了高度封装，开箱即用。

2.3. 长期记忆和短期记忆

在解决 LLM 的记忆问题时，有两种记忆方案，长期记忆和短期记忆。

短期记忆：基于内存的存储，容量有限，用于存储临时对话内容。
长期记忆：基于硬盘或者外部数据库等方式，容量较大，用于存储需要持久的信息。

3. LangChain 让 LLM 记住上下文

LangChain 提供了灵活的内存组件工具来帮助开发者为 LLM 添加记忆能力。

3.1. 单独用 ConversationBufferMemory 做短期记忆

Langchain 提供了 ConversationBufferMemory 类，可以用来存储和管理对话。

ConversationBufferMemory 包含input变量和output变量，input代表人类输入，output代表 AI 输出。

每次往ConversationBufferMemory组件里存入对话信息时，都会存储到history的变量里。

3.2. 利用 MessagesPlaceholder 手动添加 history

from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory(return_messages=True)
memory.load_memory_variables({})

memory.save_context({"input": "我的名字叫张三"}, {"output": "你好，张三"})
memory.load_memory_variables({})

memory.save_context({"input": "我是一名 IT 程序员"}, {"output": "好的，我知道了"})
memory.load_memory_variables({})

from langchain.prompts import ChatPromptTemplate
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "你是一个乐于助人的助手。"),
        MessagesPlaceholder(variable_name="history"),
        ("human", "{user_input}"),
    ]
)
chain = prompt | model

user_input = "你知道我的名字吗？"
history = memory.load_memory_variables({})["history"]


chain.invoke({"user_input": user_input, "history": history})

user_input = "中国最高的山是什么山？"
res = chain.invoke({"user_input": user_input, "history": history})
memory.save_context({"input": user_input}, {"output": res.content})


res = chain.invoke({"user_input": "我们聊得最后一个问题是什么？", "history": history})

复制

执行结果如下：

3.3. 利用 ConversationChain 自动添加 history

我们利用 LangChain 的ConversationChain对话链，自动添加history的方式添加临时记忆，无需手动添加。一个链实际上就是将一部分繁琐的小功能做了高度封装，这样多个链就可以组合形成易用的强大功能。这里链的优势一下子就体现出来了：

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder

memory = ConversationBufferMemory(return_messages=True)
chain = ConversationChain(llm=model, memory=memory)
res = chain.invoke({"input": "你好，我的名字是张三，我是一名程序员。"})
res['response']

res = chain.invoke({"input":"南京是哪个省？"})
res['response']

res = chain.invoke({"input":"我告诉过你我的名字，是什么？，我的职业是什么？"})
res['response']

复制

执行结果如下，可以看到利用ConversationChain对话链，可以让 LLM 快速拥有记忆：

3.4. 对话链结合 PromptTemplate 和 MessagesPlaceholder

在 Langchain 中，MessagesPlaceholder是一个占位符，用于在对话模板中动态插入上下文信息。它可以帮助我们灵活地管理对话内容，确保 LLM 能够使用最上下文来生成响应。

采用ConversationChain对话链结合PromptTemplate和MessagesPlaceholder，几行代码就可以轻松让 LLM 拥有短时记忆。

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "你是一个爱撒娇的女助手，喜欢用可爱的语气回答问题。"),
        MessagesPlaceholder(variable_name="history"),
        ("human", "{input}"),
    ]
)
memory = ConversationBufferMemory(return_messages=True)
chain = ConversationChain(llm=model, memory=memory, prompt=prompt)

res = chain.invoke({"input": "今天你好，我的名字是张三，我是你的老板"})
res['response']

res = chain.invoke({"input": "帮我安排一场今天晚上的高规格的晚饭"})
res['response']

res = chain.invoke({"input": "你还记得我叫什么名字吗？"})
res['response']


复制

4. 使用长期记忆

短期记忆在会话关闭或者服务器重启后，就会丢失。如果想长期记住对话信息，只能采用长期记忆组件。

LangChain 支持多种长期记忆组件，比如Elasticsearch、MongoDB、Redis等，下面以Redis为例，演示如何使用长期记忆。

from langchain_community.chat_message_histories import RedisChatMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model="gpt-3.5-turbo",
    openai_api_key="sk-xxxxxxxxxxxxxxxxxxx",
    openai_api_base="https://api.aigc369.com/v1",
)

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "你是一个擅长{ability}的助手"),
        MessagesPlaceholder(variable_name="history"),
        ("human", "{question}"),
    ]
)

chain = prompt | model

chain_with_history = RunnableWithMessageHistory(
    chain,
    # 使用redis存储聊天记录
    lambda session_id: RedisChatMessageHistory(
        session_id, url="redis://10.22.11.110:6379/3"
    ),
    input_messages_key="question",
    history_messages_key="history",
)

# 每次调用都会保存聊天记录，需要有对应的session_id
chain_with_history.invoke(
    {"ability": "物理", "question": "地球到月球的距离是多少？"},
    config={"configurable": {"session_id": "baily_question"}},
)

chain_with_history.invoke(
    {"ability": "物理", "question": "地球到太阳的距离是多少？"},
    config={"configurable": {"session_id": "baily_question"}},
)

chain_with_history.invoke(
    {"ability": "物理", "question": "地球到他俩之间谁更近"},
    config={"configurable": {"session_id": "baily_question"}},
)

复制

LLM 的回答如下，同时关闭 session 后，直接再次提问最后一个问题，LLM 仍然能给出正确答案。

只要configurable配置的session_id能对应上，LLM 就能给出正确答案。

然后，继续查看redis存储的数据，可以看到数据在 redis 中是以 list的数据结构存储的。

5. 总结

本文介绍了 LLM 缺乏记忆功能的固有缺陷，以及记忆组件的原理，还讨论了如何利用 LangChain 给 LLM 装上记忆组件，让 LLM 能够在对话中更好地保持上下文。希望对你有帮助！

======>>>>>> 关于我 <<<<<<======

本篇完结！欢迎点赞关注收藏！！！

原文链接：https://mp.weixin.qq.com/s/bWZsP5CXYxsO6dARd1LtFQ