嵌入向量
Embedding将词、句子或图像等高维离散信息压缩为稠密的低维向量,使语义相似的内容在向量空间中距离更近。
# 向量
# 语义搜索
Embedding(嵌入向量)
Embedding 是将离散对象(词、文档、用户)映射到连续向量空间的技术。
核心特性: - 语义相近的内容向量距离小 - 支持向量运算(king - man + woman ≈ queen) - 维度通常 128-4096 维
应用场景: - 语义搜索(相似度检索) - RAG 的知识库索引 - 推荐系统
常用模型: text-embedding-3-small, BGE, nomic-embed