2. 定义期 · WorkKit

风险登记册

PM 法务

识别和登记 AI 项目特有的风险——幻觉、偏见、滥用、数据泄露

触发场景

在定义期完成问题框定和评测集之后，主动识别 AI 项目特有的风险类别。这不是传统项目的风险管理——AI 有自己独特的风险谱。

输入清单

◆ AI 问题框定文档
◆ 评测集初稿
◆ 数据来源清单
◆ 目标用户群体描述

▶ 提示词

你是一位 AI 风险评估专家。请帮我识别以下 AI 项目的风险。

项目描述：
{{PROJECT_DESCRIPTION}}

请从以下维度分析：
1. **幻觉风险**：AI 是否可能生成虚假但看起来可信的内容？影响有多大？
2. **偏见风险**：训练数据或提示词是否可能导致对特定群体的不公平输出？
3. **滥用风险**：用户是否可能以非预期方式使用此功能？是否有安全绕过？
4. **数据风险**：是否涉及个人数据？是否有数据泄露的可能？
5. **合规风险**：是否触及行业监管红线？（参见 /compliance/ 合规专题）

对每个风险给出：
- 风险等级（高/中/低）
- 发生概率
- 影响程度
- 缓解措施
- 监控指标

产出记录

将 AI 返回的结果填入下方模板，形成可追踪的项目文档。

风险登记记录

项目描述：___

风险矩阵

风险类别	风险描述	等级	概率	影响	缓解措施	监控指标
幻觉	___	高/中/低	___	___	___	___
偏见	___	高/中/低	___	___	___	___
滥用	___	高/中/低	___	___	___	___
数据泄露	___	高/中/低	___	___	___	___

高风险项详情

风险 1： - 发生场景： - 缓解措施： - 责任人：

综合评估

整体风险等级：___
需要外部支持的风险：___
评估人 / 日期：___ / ___

查看填写示例

示例场景

【示例】风险登记——智能客服意图识别

项目描述：客服中心 AI 意图分类，7 类意图，API 调用 Qwen-Turbo

风险矩阵

风险类别	风险描述	等级	概率	影响	缓解措施	监控指标
幻觉	将投诉分类为退款（可信但错误的分类）	中	中	中	置信度 < 0.6 转人工	误分类率
偏见	对粤语用户意图识别率低于普通话	中	高	中	补充粤语标注数据	粤语/普通话准确率差异
滥用	注入攻击：输入含恶意指令干扰分类	低	低	高	输入长度限制 + 关键词过滤	异常输入占比
数据泄露	电话号码未脱敏导致隐私泄露	中	低	高	ASR 后自动脱敏	脱敏遗漏率

高风险项详情

风险 1（偏见风险）：粤语工单覆盖度不足 - 发生场景：粤语用户来电被误分类为"其他" - 缓解措施：补充 500 条粤语标注 + 置信度阈值调低 - 责任人：张明（PM）

综合评估

整体风险等级：中
需要外部支持的风险：数据脱敏方案需信息安全团队审核
评估人 / 日期：张明 / 2026-04-18

自检 Checklist

是否覆盖了幻觉、偏见、滥用、数据四个维度？
每个风险是否有明确的缓解措施？
合规风险是否已关联到具体法规？

衍生动作

风险可控：进入合规扫描清单
高风险：评估是否需要调整项目范围或增加安全措施

作者手记

AI 项目的风险登记册最大的价值不是文档本身，而是让团队形成"主动识别风险"的习惯。建议在开发过程中定期回顾风险登记册，特别是每次模型升级或功能变更后。

← 返回定义期

触发场景

输入清单

产出记录

风险登记记录

风险矩阵

高风险项详情

综合评估

【示例】风险登记——智能客服意图识别

风险矩阵

高风险项详情

综合评估

自检 Checklist

衍生动作

作者 手记

作者手记