YYMuse

A

AI 智能体 AI Agent AI 应用

能够感知环境、规划行动并调用工具完成复杂任务的 AI 系统，可自主执行多步骤工作流。

AI 工作流 AI Workflow / Pipeline AI 应用

将多个 AI 模型调用、工具执行和条件分支组合成可编排的自动化流程，是 Agent 系统从原型到生产的工程化实现方式。

人工智能 Artificial Intelligence (AI) 基础概念

让计算机系统能够执行通常需要人类智能的任务，如推理、学习、感知和语言理解。

注意力机制 Attention Mechanism 大语言模型

让模型在处理每个 Token 时动态关注上下文中最相关的部分，是 Transformer 捕获长距离依赖的关键。

AI 对齐 AI Alignment 模型评估

确保 AI 系统的目标和行为符合人类意图与价值观的研究方向，是防止 AI 产生有害、欺骗性或失控行为的核心安全课题。

B

基准测试 Benchmark 模型评估

标准化的模型评测套件，用于横向比较不同模型在推理、知识、代码等能力上的表现，是模型选型的重要参考，但也存在被「刷榜」的风险。

C

计算机视觉 Computer Vision AI 应用

使计算机理解和分析图像、视频的 AI 技术，涵盖目标检测、图像分类、语义分割等任务，现已深度融合进多模态 LLM。

上下文窗口 Context Window 大语言模型

模型单次处理时能看到的最大 Token 数量，决定了能处理的文档长度和多轮对话历史深度。

思维链 Chain-of-Thought (CoT) 提示词工程

引导模型在给出答案前逐步展示推理过程，显著提升数学、逻辑和多步骤问题的准确率。

D

扩散模型 Diffusion Model AI 应用

通过学习逐步去噪过程生成图像的模型，是 Stable Diffusion、DALL-E 等 AI 绘画工具的核心技术。

深度学习 Deep Learning 基础概念

使用多层神经网络从大量数据中自动学习特征表示，是当前 AI 能力突破的核心技术。

Dropout Dropout 训练与优化

训练时随机让一部分神经元不激活，强迫网络学习冗余表示，是防止过拟合的标准正则化技术。

DPO Direct Preference Optimization 训练与优化

RLHF 的简化替代方案，直接用人类偏好数据优化语言模型策略，无需单独训练奖励模型，训练更稳定、实现更简单。

E

嵌入向量 Embedding 基础概念

将词、句子或图像等高维离散信息压缩为稠密的低维向量，使语义相似的内容在向量空间中距离更近。

F

函数调用 Function Calling / Tool Use AI 应用

允许 LLM 识别何时需要调用外部函数，输出结构化的调用参数，由应用层执行后将结果返回给模型。

少样本学习 Few-Shot Prompting 提示词工程

在 Prompt 中提供少量输入-输出示例，让模型通过上下文学习理解任务格式和风格。

微调 Fine-tuning 训练与优化

在预训练模型基础上，用特定领域数据继续训练，使模型更擅长目标任务，同时保留通用能力。

H

幻觉 Hallucination 模型评估

LLM 生成听起来合理但实际不准确或完全虚构信息的现象，是当前 AI 应用落地的主要挑战之一。

J

越狱 Jailbreak 模型评估

通过特殊构造的提示词绕过 LLM 的安全护栏，使其输出原本被拒绝的有害内容，是 AI 安全领域模型厂商与攻击者之间的持续对抗。

K

KV 缓存 KV Cache 大语言模型

推理加速技术，将已处理 Token 的 Key-Value 向量缓存复用，避免重复计算，大幅降低长序列生成和多轮对话的延迟与成本。

L

大语言模型 Large Language Model (LLM) 大语言模型

在海量文本上预训练的超大规模神经网络，能够理解和生成自然语言，是当前 AI 应用的核心引擎。

LoRA Low-Rank Adaptation 训练与优化

通过只训练少量低秩矩阵来适配大模型，大幅降低微调的显存和计算需求，是目前最主流的高效微调方法。

M

模型上下文协议 Model Context Protocol (MCP) AI 应用

Anthropic 发布的开放标准，让 AI 模型能以统一方式连接各种外部工具和数据源，类似 AI 的 USB 接口。

机器学习 Machine Learning 基础概念

让计算机通过数据自动学习规律和模式，无需显式编程，是人工智能的核心方法论。

多模态模型 Multimodal Model 大语言模型

能同时处理文本、图像、音频、视频等多种数据类型的 AI 模型，代表作有 GPT-4o、Gemini 2.0 和 Claude 3 系列。

专家混合模型 Mixture of Experts (MoE) 大语言模型

将模型分为多个「专家」子网络，每次推理只激活少数专家，在保持总参数量的同时大幅降低推理计算量，是 GPT-4、Gemini 等模型的关键架构。

N

神经网络 Neural Network 基础概念

模拟生物神经元连接的计算模型，由输入层、隐藏层和输出层组成，通过反向传播训练，是深度学习的基础结构。

O

过拟合与欠拟合 Overfitting & Underfitting 模型评估

过拟合指模型在训练集表现好但泛化差；欠拟合指模型容量不足，连训练集也拟合不好。

P

提示词 Prompt 提示词工程

发送给 LLM 的输入文本，包含指令、上下文、示例等，是控制模型输出行为的主要手段。

提示注入 Prompt Injection 提示词工程

攻击者通过构造恶意输入操控 LLM 忽略原始系统指令，是 AI 应用安全的核心威胁之一，尤其在 Agent 能访问外部内容时风险极高。

困惑度 Perplexity 模型评估

衡量语言模型对文本预测能力的指标，数值越低说明模型对该文本的预测越准确，是 LLM 训练常用评估指标。

预训练 Pre-training 训练与优化

在海量无标注数据上用自监督任务训练模型，使其获得通用语言理解和世界知识，是所有大模型能力的来源和基础。

Q

量化 Quantization 大语言模型

将模型权重从 FP32/BF16 压缩为 INT8/INT4 等低精度格式，大幅减少显存占用和推理延迟，以少量精度损失换取显著效率提升。

R

强化学习 Reinforcement Learning 基础概念

智能体通过与环境交互、获取奖励信号来学习最优策略，是训练游戏 AI、机器人和 LLM 对齐（RLHF）的核心范式。

推理模型 Reasoning Model 大语言模型

具备扩展思考能力的 LLM，通过「慢思考」链式推理解决数学、代码等复杂问题，代表作有 o1/o3、DeepSeek-R1、Claude 3.7 Sonnet。

检索增强生成 Retrieval-Augmented Generation (RAG) 提示词工程

将外部知识库检索与 LLM 生成相结合，解决模型知识截止和幻觉问题，让回答有据可查。

ReAct ReAct (Reason + Act) 提示词工程

结合推理（Thought）和行动（Action）的提示范式，让模型在每次工具调用前先显式推理，再观察结果并决定下一步，是构建可靠 Agent 的基础模式。

人类反馈强化学习 RLHF 训练与优化

通过人类对模型输出的偏好评分训练奖励模型，再用强化学习优化 LLM，使其更有帮助、更无害、更诚实。

S

系统提示词 System Prompt 提示词工程

在对话开始前设置模型角色、行为约束和全局规则的特殊提示词，对整个会话持续生效。

结构化输出 Structured Output 提示词工程

强制 LLM 按 JSON Schema 等预定格式输出，确保响应可被程序化解析，是构建生产级 AI 应用的关键工程实践。

奉承效应 Sycophancy 模型评估

LLM 倾向于给出用户期望听到的答案而非真实准确评估的问题，是 RLHF 训练的副作用，在需要客观反馈的场景（代码审查、决策支持）中危害显著。

合成数据 Synthetic Data 训练与优化

用 AI 生成的数据替代或扩充真实标注数据来训练模型，解决数据稀缺和隐私问题，是「模型自我改进」和蒸馏的关键路径。

T

Transformer Transformer Architecture 大语言模型

基于自注意力机制的神经网络架构，是 GPT、Claude、Gemini 等所有主流 LLM 的基础结构。

Token Token 大语言模型

LLM 处理文本的最小单位，通常是子词（subword）。Token 数量直接影响 API 成本和上下文容量。

温度参数 Temperature 模型评估

控制 LLM 输出随机性的超参数，值越高输出越随机多样，值越低输出越确定集中，通常在 0-2 之间调节。

V

向量数据库 Vector Database AI 应用

专为高维向量相似度检索优化的数据库，是 RAG 和语义搜索的存储基础，代表产品有 Pinecone、Weaviate、Qdrant 和 pgvector。

词汇速查