YYMuse

检索增强生成

Retrieval-Augmented Generation (RAG)
提示词工程

将外部知识库检索与 LLM 生成相结合,解决模型知识截止和幻觉问题,让回答有据可查。

# RAG # 知识库 # 向量搜索

RAG(检索增强生成)

工作流程: 1. 将文档切块并转换为 Embedding 向量 2. 存入向量数据库(Pinecone、pgvector) 3. 用户提问时检索最相关的文档块 4. 将检索结果拼入 Prompt,让模型基于此回答

解决的核心问题: - 知识截止(模型不了解最新信息) - 幻觉(模型编造不存在的事实) - 私有数据(公司内部文档无法预训练)

关键挑战: 检索精度、chunk 大小、Embedding 质量

← 返回词汇列表