YYMuse

检索增强生成

Retrieval-Augmented Generation (RAG)

提示词工程

将外部知识库检索与 LLM 生成相结合，解决模型知识截止和幻觉问题，让回答有据可查。

# RAG # 知识库 # 向量搜索

RAG（检索增强生成）

工作流程： 1. 将文档切块并转换为 Embedding 向量 2. 存入向量数据库（Pinecone、pgvector） 3. 用户提问时检索最相关的文档块 4. 将检索结果拼入 Prompt，让模型基于此回答

解决的核心问题： - 知识截止（模型不了解最新信息） - 幻觉（模型编造不存在的事实） - 私有数据（公司内部文档无法预训练）

关键挑战： 检索精度、chunk 大小、Embedding 质量