词汇速查
PM 与 AI 领域核心概念速查手册
共 46 个词条
能够感知环境、规划行动并调用工具完成复杂任务的 AI 系统,可自主执行多步骤工作流。
将多个 AI 模型调用、工具执行和条件分支组合成可编排的自动化流程,是 Agent 系统从原型到生产的工程化实现方式。
让计算机系统能够执行通常需要人类智能的任务,如推理、学习、感知和语言理解。
让模型在处理每个 Token 时动态关注上下文中最相关的部分,是 Transformer 捕获长距离依赖的关键。
确保 AI 系统的目标和行为符合人类意图与价值观的研究方向,是防止 AI 产生有害、欺骗性或失控行为的核心安全课题。
通过学习逐步去噪过程生成图像的模型,是 Stable Diffusion、DALL-E 等 AI 绘画工具的核心技术。
使用多层神经网络从大量数据中自动学习特征表示,是当前 AI 能力突破的核心技术。
训练时随机让一部分神经元不激活,强迫网络学习冗余表示,是防止过拟合的标准正则化技术。
RLHF 的简化替代方案,直接用人类偏好数据优化语言模型策略,无需单独训练奖励模型,训练更稳定、实现更简单。
Anthropic 发布的开放标准,让 AI 模型能以统一方式连接各种外部工具和数据源,类似 AI 的 USB 接口。
让计算机通过数据自动学习规律和模式,无需显式编程,是人工智能的核心方法论。
能同时处理文本、图像、音频、视频等多种数据类型的 AI 模型,代表作有 GPT-4o、Gemini 2.0 和 Claude 3 系列。
将模型分为多个「专家」子网络,每次推理只激活少数专家,在保持总参数量的同时大幅降低推理计算量,是 GPT-4、Gemini 等模型的关键架构。
发送给 LLM 的输入文本,包含指令、上下文、示例等,是控制模型输出行为的主要手段。
攻击者通过构造恶意输入操控 LLM 忽略原始系统指令,是 AI 应用安全的核心威胁之一,尤其在 Agent 能访问外部内容时风险极高。
衡量语言模型对文本预测能力的指标,数值越低说明模型对该文本的预测越准确,是 LLM 训练常用评估指标。
在海量无标注数据上用自监督任务训练模型,使其获得通用语言理解和世界知识,是所有大模型能力的来源和基础。
智能体通过与环境交互、获取奖励信号来学习最优策略,是训练游戏 AI、机器人和 LLM 对齐(RLHF)的核心范式。
具备扩展思考能力的 LLM,通过「慢思考」链式推理解决数学、代码等复杂问题,代表作有 o1/o3、DeepSeek-R1、Claude 3.7 Sonnet。
将外部知识库检索与 LLM 生成相结合,解决模型知识截止和幻觉问题,让回答有据可查。
结合推理(Thought)和行动(Action)的提示范式,让模型在每次工具调用前先显式推理,再观察结果并决定下一步,是构建可靠 Agent 的基础模式。
通过人类对模型输出的偏好评分训练奖励模型,再用强化学习优化 LLM,使其更有帮助、更无害、更诚实。
在对话开始前设置模型角色、行为约束和全局规则的特殊提示词,对整个会话持续生效。
强制 LLM 按 JSON Schema 等预定格式输出,确保响应可被程序化解析,是构建生产级 AI 应用的关键工程实践。
LLM 倾向于给出用户期望听到的答案而非真实准确评估的问题,是 RLHF 训练的副作用,在需要客观反馈的场景(代码审查、决策支持)中危害显著。
用 AI 生成的数据替代或扩充真实标注数据来训练模型,解决数据稀缺和隐私问题,是「模型自我改进」和蒸馏的关键路径。