向量数据库
Vector Database专为高维向量相似度检索优化的数据库,是 RAG 和语义搜索的存储基础,代表产品有 Pinecone、Weaviate、Qdrant 和 pgvector。
# RAG
# 向量搜索
# 基础设施
向量数据库
核心能力: 给定一个查询向量,快速找出最相似的 K 个向量(最近邻搜索,ANN)。
与传统数据库的区别:
| 关系型数据库 | 向量数据库 | |
|---|---|---|
| 查询方式 | 精确匹配(WHERE id=1) | 相似度匹配(最近邻) |
| 数据类型 | 结构化行列 | 高维向量 |
| 索引算法 | B-Tree、Hash | HNSW、IVF |
主流选型: - Pinecone:托管服务,开箱即用 - Weaviate / Qdrant:开源,可自托管 - pgvector:PostgreSQL 扩展,已有 PG 的首选 - ChromaDB:本地开发友好
RAG 工作流: 文档切块 → Embedding → 存入向量库 → 检索 Top-K → 拼入 Prompt。
提示: 已有 PostgreSQL 的项目优先考虑 pgvector,避免引入额外基础设施。