与#rag#相关的内容 - PmDaddy

全部分类数据库前端云计算

我对《RAG/大模型/非结构化数据知识库类产品》技术架构的思考、杂谈

1、前言在6.28/29的稀土掘金开发者大会RAG专场上，我们公司CEO员外代表TorchV分享了我们在《RAG在企业应用中落地的难点与创新》其中最后分享了两个观点： AI在应用场景落地时有三个特点：功能小、质量高、价值大如果说做产品是把一横做好的话，那么去做企业落地服务就是一竖，从需求和方案

开源一个RAG大模型本地知识库问答机器人

弹指间，2009年大学毕业到现在2024年，已经15年过去了。前2天，看到自己14年在博客园写的一个博客，哪个时候是工作之余创业感兴趣的朋友可以看看我10年前发的一篇博客 https://www.cnblogs.com/likwo/p/3832795.html 目前全职创业中，用过不少开源软件，

RAG工程实践拦路虎之一：PDF格式解析杂谈

背景 PDF（Portable Document Format）是一种广泛用于文档交换的文件格式，由Adobe Systems开发。它具有跨平台性、固定布局和易于打印等特点，因此在商业、学术和个人领域广泛应用。然而，PDF文件的解析一直是一个具有挑战性的问题，因为其内部结构的复杂性和多样性，使得提取

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统什么是 RAG LLM 会产生误导性的 “幻觉”，依赖的信息可能过时，处理特定知识时效率不高，缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。正是在这样的背景下，检索增强生成技术（Retrieval-Augm

构建RAG应用-day05: 如何评估 LLM 应用评估并优化生成部分评估并优化检索部分

评估 LLM 应用 1.一般评估思路首先，你会在一到三个样本的小样本中调整 Prompt ，尝试使其在这些样本上起效。随后，当你对系统进行进一步测试时，可能会遇到一些棘手的例子，这些例子无法通过 Prompt 或者算法解决。最终，你会将足够多的这些例子添加到你逐步扩大的开发集中，以至于手动运行

rerank来提升RAG的准确度的策略

RAG（Retrieval-Augmented Generation）是一种结合检索和生成两种技术的模型，旨在通过检索大规模知识库来增强文本生成任务的准确性。要通过reranking（重排序）来提升RAG的准确度，可以采取以下策略： 1. 使用更精细的评分函数 RAG通常会在检索阶段根据输入问题或

【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取

前言文档分割是一项具有挑战性的任务，它是任何知识库问答系统的基础。高质量的文档分割结果对于显著提升问答效果至关重要，但是目前大多数开源库的处理能力有限。这些开源的库或者方法缺点大致可以罗列如下：只能处理文本，无法提取表格中的内容缺乏有效的分割策略，要么是一整个文档全部提取，要么是词粒度的获取

Vector | Graph：蚂蚁首个开源Graph RAG框架设计解读

引入知识图谱技术后，传统RAG链路到Graph RAG链路会有什么样的变化，如何兼容RAG中的向量数据库（Vector Database）和图数据库（Graph Database）基座，以及蚂蚁的Graph RAG开源技术方案和未来优化方向。

使用 TiDB Vector 搭建 RAG 应用 - TiDB 文档问答小助手

本文首发至TiDB社区专栏：https://tidb.net/blog/7a8862d5 前言继上一次《TiDB Vector抢先体验之用TiDB实现以图搜图》后，就迫不及待的想做一些更复杂的应用。上一篇在 TiDB 社区专栏发布以后还是有很多社区朋友不明白向量的应用场景到底是什么，这次用一个更直

利用英特尔 Gaudi 2 和至强 CPU 构建经济高效的企业级 RAG 应用

检索增强生成 (Retrieval Augmented Generation，RAG) 可将存储在外部数据库中的新鲜领域知识纳入大语言模型以增强其文本生成能力。其提供了一种将公司数据与训练期间语言模型学到的知识分开的方式，有助于我们在性能、准确性及安全隐私之间进行有效折衷。通过本文，你将了解到英特

Google出品的NotebookLM 人工智能笔记本，一款基于RAG的personalized AI产品

Google推出了实验性的NotebookLM产品，一款基于RAG的个性化AI助手产品，基于用户提供的可信信息，通过RAG，帮助用户洞察和学习参考内容，然后借助AI整理笔记，转换为用户最终需要的大纲、博客、商业计划书等最终目的。

解密Prompt系列32. LLM之表格理解任务-文本模态

这一章我们聊聊大模型表格理解任务，在大模型时代主要出现在包含表格的RAG任务，以及表格操作数据抽取文本对比等任务中。这一章先聊单一的文本模态，我们分别介绍微调和基于Prompt的两种方案。

用 Sentence Transformers v3 训练和微调嵌入模型

Sentence Transformers 是一个 Python 库，用于使用和训练各种应用的嵌入模型，例如检索增强生成 (RAG)、语义搜索、语义文本相似度、释义挖掘 (paraphrase mining) 等等。其 3.0 版本的更新是该工程自创建以来最大的一次，引入了一种新的训练方法。在这篇博

使用ChatGPT自动构建知识图谱

1.概述本文将探讨利用OpenAI的gpt-3.5-turbo从原始文本构建知识图谱，通过LLM和RAG技术实现文本生成、问答和特定领域知识的高效提取，以获得有价值的洞察。在开始前，我们需要明确一些关键概念。 2.内容 2.1 什么是知识图谱？知识图谱是一种语义网络，它表示和连接现实世界中的实体

实战0-1,Java开发者也能看懂的大模型应用开发实践！！！

前言在前几天的文章《续写AI技术新篇,融汇工程化实践》中，我分享说在RAG领域，很多都是工程上的实践，做AI大模型应用的开发其实Java也能写，那么本文就一个Java开发者的立场，构建实现一个最基础的大模型应用系统。而大模型应用系统其实在目前阶段，可能应用最广的还是RAG领域，因此，本文也是通过

解析QAnything启动命令过程

一.启动命令过程日志启动命令bash ./run.sh -c local -i 0 -b hf -m Qwen-1_8B-Chat -t qwen-7b-chat。输入日志如下所示： root@MM-202203161213:/mnt/l/20230918_RAG方向/QAnything# bas

LangChain结合LLM做私有化文档搜索

我们知道LLM（大语言模型）的底模是基于已经过期的公开数据训练出来的，对于新的知识或者私有化的数据LLM一般无法作答，此时LLM会出现“幻觉”。针对“幻觉”问题，一般的解决方案是采用RAG做检索增强。

Bi-encoder vs Cross encoder?

本文永久地址：https://wanger-sjtu.github.io/encoder-cross-bi/ Bi-encoder和Cross-encoder是在自然语言理解任务模型的两种不同方法，在信息检索和相似性搜索二者的使用更为广泛。在LLM大火的今天，RAG的pipe line中这两个模块作

微软开源 MS-DOS「GitHub 热点速览」

上周又是被「大模型」霸榜的一周，各种 AI、LLM、ChatGPT、Sora、RAG 的开源项目在 GitHub 上“争相斗艳”。这不 Meta 刚开源 Llama 3 没几天，苹果紧跟着就开源了手机端大模型：CoreNet。 GitHub 地址：github.com/apple/corenet 开

首页
上一页
1
下一页
尾页

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化