RAG 进阶之路5:Milvus 中实现“时间衰减”
在构建 RAG系统时,我们经常会遇到这样一个尴尬的场景: 用户问:“最新的 iPhone 摄像头参数怎么样?” 你的 RAG 系统兴致勃勃地从数据库里找出了 iPhone 11 的评测文章,因为那篇文章写得非常详尽,和问题的语义相似度(Semantic Similarity)极高。而关于 iPhone 12 的介绍可能比较简短,导致向量距离稍远,被排在了后面。 这就是向量检索的“时效性盲区”。 在 HNSW 或 IVF 这样的向量索引眼里,只有空间距离,没有时间概念。数据一旦写入,它在向量空间的位置就是永恒的。但在新闻、金融或日志分析等场景中,“新”往往比“准”更重要。 那么,在使用 Milvus 或 Faiss 时,我们如何引入时间衰减(Time Decay)…