YYMuse

词汇速查

PM 与 AI 领域核心概念速查手册

PM 词汇 AI 概念

全部 AI 应用基础概念大语言模型提示词工程模型评估训练与优化

共 7 个词条

D

Dropout Dropout 训练与优化

训练时随机让一部分神经元不激活，强迫网络学习冗余表示，是防止过拟合的标准正则化技术。

DPO Direct Preference Optimization 训练与优化

RLHF 的简化替代方案，直接用人类偏好数据优化语言模型策略，无需单独训练奖励模型，训练更稳定、实现更简单。

F

微调 Fine-tuning 训练与优化

在预训练模型基础上，用特定领域数据继续训练，使模型更擅长目标任务，同时保留通用能力。

L

LoRA Low-Rank Adaptation 训练与优化

通过只训练少量低秩矩阵来适配大模型，大幅降低微调的显存和计算需求，是目前最主流的高效微调方法。

P

预训练 Pre-training 训练与优化

在海量无标注数据上用自监督任务训练模型，使其获得通用语言理解和世界知识，是所有大模型能力的来源和基础。

R

人类反馈强化学习 RLHF 训练与优化

通过人类对模型输出的偏好评分训练奖励模型，再用强化学习优化 LLM，使其更有帮助、更无害、更诚实。

S

合成数据 Synthetic Data 训练与优化

用 AI 生成的数据替代或扩充真实标注数据来训练模型，解决数据稀缺和隐私问题，是「模型自我改进」和蒸馏的关键路径。