BERT - Gloary Lei

RAG 进阶之路4：LangChain + Milvus + BGE 全流程实战

By Gloary Lei in RAG on 02 Jul 2023

在前两篇文章中，我们已经达成了共识：“Milvus + BGE-base + BGE-Reranker” 是目前构建中文 RAG 系统的高性价比黄金组合。今天，我们将使用 LangChain 框架将这三个组件串联起来，构建一个真正具备“漏斗式检索”能力的 RAG pipline。准备工作在开始之前，请确保你已经安装了 Docker 并启动了 Milvus 实例。同时，你需要安装以下 Python 库： pip install langchain langchain-community langchain-huggingface pymilvus sentence-transformers 注：我们将使用最新的 langchain-huggingface 库来加载模型，这是 LangChain 官方推荐的现代化方式。核心架构设计我们的代码将遵循以下数据流： 1. 加载与切分 (Load & Split): 将长文档切分成…

RAG 进阶之路3：从 BERT 到 BGE揭秘 RAG 系统的“语义引擎”

By Gloary Lei in RAG on 26 Jun 2023

上一篇我们搞定了“身体”（Milvus 向量数据库），这一篇我们要赋予系统“灵魂”（语义理解）。很多开发者有一个误区：认为 RAG 的效果主要取决于大模型（LLM）的智商。其实不然，RAG 的“生死线”在于检索（Retrieval）。如果你喂给 LLM 的是垃圾文档，在好的LLM 也救不了你。而决定检索质量的核心，就是 Embedding（向量化）和 Rerank（重排序）模型。在上一章中，我们搭建了 Milvus 向量数据库，它就像是一个巨大的、极其高效的图书馆书架。但是，把书放上去只是第一步，最难的是：当用户问“苹果怎么吃”时，你怎么知道要把关于“水果”的书给他，而不是关于“iPhone 手机”…