Milvus - Gloary Lei

RAG 进阶之路5：Milvus 中实现“时间衰减”

By Gloary Lei in RAG on 05 Jul 2023

在构建 RAG系统时，我们经常会遇到这样一个尴尬的场景：用户问：“最新的 iPhone 摄像头参数怎么样？” 你的 RAG 系统兴致勃勃地从数据库里找出了 iPhone 11 的评测文章，因为那篇文章写得非常详尽，和问题的语义相似度（Semantic Similarity）极高。而关于 iPhone 12 的介绍可能比较简短，导致向量距离稍远，被排在了后面。这就是向量检索的“时效性盲区”。在 HNSW 或 IVF 这样的向量索引眼里，只有空间距离，没有时间概念。数据一旦写入，它在向量空间的位置就是永恒的。但在新闻、金融或日志分析等场景中，“新”往往比“准”更重要。那么，在使用 Milvus 或 Faiss 时，我们如何引入时间衰减（Time Decay）…

RAG 进阶之路4：LangChain + Milvus + BGE 全流程实战

By Gloary Lei in RAG on 02 Jul 2023

在前两篇文章中，我们已经达成了共识：“Milvus + BGE-base + BGE-Reranker” 是目前构建中文 RAG 系统的高性价比黄金组合。今天，我们将使用 LangChain 框架将这三个组件串联起来，构建一个真正具备“漏斗式检索”能力的 RAG pipline。准备工作在开始之前，请确保你已经安装了 Docker 并启动了 Milvus 实例。同时，你需要安装以下 Python 库： pip install langchain langchain-community langchain-huggingface pymilvus sentence-transformers 注：我们将使用最新的 langchain-huggingface 库来加载模型，这是 LangChain 官方推荐的现代化方式。核心架构设计我们的代码将遵循以下数据流： 1. 加载与切分 (Load & Split): 将长文档切分成…

RAG 进阶之路2：Milvus 架构深度剖析与索引详解

By Gloary Lei in Milvus on 20 Jun 2023

为什么说 Milvus 2.0 是云原生的？它如何通过“存算分离”实现无限扩展？从 Kafka 的多路消费到 HNSW 的参数调优，本文配合详细架构图，深度拆解 Milvus 的内核机制。在 RAG 系统中，向量数据库（Vector Database）是长时记忆的载体。许多开发者在初次接触时，往往会选择 Faiss 这样的轻量级库。但当数据量突破千万级，或者需要高并发、高可用（HA）支持时，架构完善的数据库系统就成为了必然选择。 Milvus 是目前最主流的云原生向量数据库之一。与传统数据库不同，它采用了存储与计算完全分离的设计。这意味着，如果你还没看懂它的架构，你可能正在浪费大量的服务器资源，或者在面对“为什么刚插的数据搜不到？”这种问题时束手无策。今天，我们通过一张图，并结合日志流转和索引原理，彻底看懂 Milvus 是如何工作的。…