Gloary Lei (Page 4)

RAG 进阶之路4：LangChain + Milvus + BGE 全流程实战

By Gloary Lei in RAG on 02 Jul 2023

在前两篇文章中，我们已经达成了共识：“Milvus + BGE-base + BGE-Reranker” 是目前构建中文 RAG 系统的高性价比黄金组合。今天，我们将使用 LangChain 框架将这三个组件串联起来，构建一个真正具备“漏斗式检索”能力的 RAG pipline。准备工作在开始之前，请确保你已经安装了 Docker 并启动了 Milvus 实例。同时，你需要安装以下 Python 库： pip install langchain langchain-community langchain-huggingface pymilvus sentence-transformers 注：我们将使用最新的 langchain-huggingface 库来加载模型，这是 LangChain 官方推荐的现代化方式。核心架构设计我们的代码将遵循以下数据流： 1. 加载与切分 (Load & Split): 将长文档切分成…

RAG 进阶之路3：从 BERT 到 BGE揭秘 RAG 系统的“语义引擎”

By Gloary Lei in RAG on 26 Jun 2023

上一篇我们搞定了“身体”（Milvus 向量数据库），这一篇我们要赋予系统“灵魂”（语义理解）。很多开发者有一个误区：认为 RAG 的效果主要取决于大模型（LLM）的智商。其实不然，RAG 的“生死线”在于检索（Retrieval）。如果你喂给 LLM 的是垃圾文档，在好的LLM 也救不了你。而决定检索质量的核心，就是 Embedding（向量化）和 Rerank（重排序）模型。在上一章中，我们搭建了 Milvus 向量数据库，它就像是一个巨大的、极其高效的图书馆书架。但是，把书放上去只是第一步，最难的是：当用户问“苹果怎么吃”时，你怎么知道要把关于“水果”的书给他，而不是关于“iPhone 手机”…

RAG 进阶之路2：Milvus 架构深度剖析与索引详解

By Gloary Lei in Milvus on 20 Jun 2023

为什么说 Milvus 2.0 是云原生的？它如何通过“存算分离”实现无限扩展？从 Kafka 的多路消费到 HNSW 的参数调优，本文配合详细架构图，深度拆解 Milvus 的内核机制。在 RAG 系统中，向量数据库（Vector Database）是长时记忆的载体。许多开发者在初次接触时，往往会选择 Faiss 这样的轻量级库。但当数据量突破千万级，或者需要高并发、高可用（HA）支持时，架构完善的数据库系统就成为了必然选择。 Milvus 是目前最主流的云原生向量数据库之一。与传统数据库不同，它采用了存储与计算完全分离的设计。这意味着，如果你还没看懂它的架构，你可能正在浪费大量的服务器资源，或者在面对“为什么刚插的数据搜不到？”这种问题时束手无策。今天，我们通过一张图，并结合日志流转和索引原理，彻底看懂 Milvus 是如何工作的。…

RAG 进阶之路1：大模型如何跨越“知识幻觉”的鸿沟

By Gloary Lei in RAG on 16 Jun 2023

如果你曾问过 ChatGPT：“今天我公司的股价是多少？”或者“请总结一下刚才我上传的这篇 PDF 文档”，你其实就已经触碰到了 RAG (Retrieval-Augmented Generation，检索增强生成) 的边缘。在人工智能的浪潮中，大语言模型（LLM）展现出了惊人的才华，它们像是一个博古通今的学者，读完了互联网上几乎所有的书。但这个学者有两个致命的缺陷：第一，他的记忆停留在了训练结束的那一天（知识截止）；第二，他非常自信，即使不知道答案，也会一本正经地胡说八道（幻觉）。 RAG，就是为了治愈这两个“顽疾”而诞生的技术方案。作为本系列文章的开篇，我们将带你回到原点，探讨 RAG 是什么，它为何成为 AI 应用的主流范式，以及在实际工程落地中，我们正在面临哪些棘手的挑战。什么是 RAG？一场“开卷考试” 如果把大模型（如 GPT, Llama,…

yolo笔记3：部署 YOLOv8 自动标注后端 (ML Backend)

By Gloary Lei in 计算机视觉 on 18 Apr 2023

在第一篇中，我们部署了 Label Studio；在第二篇中，我们清洗数据并训练了 YOLOv8 模型。现在，我们要完成“闭环”：将训练好的 YOLO 模型部署为 Label Studio 的后端服务，实现 AI 辅助自动标注。这意味着：你上传新图片后，AI 会自动帮你画好框，你只需要微调即可。效率提升神器！简介纯手工标注是枯燥且低效的。Label Studio 最强大的功能之一就是 "Human-in-the-loop"（人机协同）： 1. 预标注：模型先预测一遍。 2. 人工修正：人类只需调整不准的框。 3. 循环迭代：修正后的数据再次训练模型，模型越来越准。本文将教你如何使用 Docker 编写并部署一个自定义的 YOLOv8 ML…

yolo笔记2：从标注到 YOLOv8 训练

By Gloary Lei in 计算机视觉 on 05 Apr 2023

简介当你完成了 Label Studio 的标注工作，点击“导出”时，你会发现导出的文件结构并不能直接用于 YOLOv8 训练。 YOLO 模型对数据集有严格的要求：训练/验证集必须物理隔离，且必须包含 data.yaml 配置文件。手动整理几千张图片不仅耗时，还容易出错（比如把猫的标签对应到了狗的图上）。本文将提供一个 Python 脚本，一键解决数据清洗、划分和配置生成的问题。第一步：从 Label Studio 导出 1. 进入项目，点击右上角 Export。 2. 格式选择 YOLO。 3. 下载并解压 ZIP 包。解压后的目录结构（假设文件夹名为 ls_export）： ls_export/ ├── classes.…

yolo笔记1：Label Studio 部署

By Gloary Lei in 计算机视觉 on 02 Apr 2023

简介在计算机视觉和 NLP 项目中，数据标注往往是最耗时的一环。Label Studio 是目前最流行的开源数据标注工具之一，它界面友好、配置灵活，支持图像、文本、音频等多种数据格式。本文将介绍如何使用 Docker 部署 Label Studio，涵盖从个人快速测试到基于数据库的生产环境两种方案，并教你如何直接读取本地硬盘上的大量图片。方案一：快速启动（适合个人测试）如果你只是想快速体验一下，或者标注的数据量很小（几百张图片），直接使用 Docker 命令行启动是最简单的方式。 1. 启动命令确保你已安装 Docker，然后在终端运行： docker run -it -p 8080:8080 \ -v $(pwd)/mydata:/label-studio/data \ heartexlabs/label-studio:latest 2. 参数解析…

WSL 2 配置、迁移与 Docker AI 环境搭建

By Gloary Lei in WSL on 24 Nov 2022

前言：为什么你不再需要虚拟机？对于 Windows 用户来说，想要体验 Linux 环境，过去的选择只有 VMware、VirtualBox 或者双系统。但这些方案要么资源占用巨大，要么显卡直通（GPU Passthrough）配置堪比“地狱难度”。 WSL 2 (Windows Subsystem for Linux 2) 的出现彻底改变了这一局面。 * 真内核：自 2020 年发布以来，它拥有完整的 Linux 内核。 * 高性能：文件 I/O 速度大幅提升。 * AI 神器：它可以直接调用宿主机的 NVIDIA 显卡进行 CUDA 计算，无需在 Linux 内部折腾复杂的显卡驱动。无论你是 X99…