检索增强生成
Retrieval-Augmented Generation (RAG)将外部知识库检索与 LLM 生成相结合,解决模型知识截止和幻觉问题,让回答有据可查。
# RAG
# 知识库
# 向量搜索
RAG(检索增强生成)
工作流程: 1. 将文档切块并转换为 Embedding 向量 2. 存入向量数据库(Pinecone、pgvector) 3. 用户提问时检索最相关的文档块 4. 将检索结果拼入 Prompt,让模型基于此回答
解决的核心问题: - 知识截止(模型不了解最新信息) - 幻觉(模型编造不存在的事实) - 私有数据(公司内部文档无法预训练)
关键挑战: 检索精度、chunk 大小、Embedding 质量