2. 定义期 · WorkKit
风险登记册
PM
法务
识别和登记 AI 项目特有的风险——幻觉、偏见、滥用、数据泄露
触发场景
在定义期完成问题框定和评测集之后,主动识别 AI 项目特有的风险类别。这不是传统项目的风险管理——AI 有自己独特的风险谱。
输入清单
- ◆ AI 问题框定文档
- ◆ 评测集初稿
- ◆ 数据来源清单
- ◆ 目标用户群体描述
▶ 提示词
你是一位 AI 风险评估专家。请帮我识别以下 AI 项目的风险。
项目描述:
{{PROJECT_DESCRIPTION}}
请从以下维度分析:
1. **幻觉风险**:AI 是否可能生成虚假但看起来可信的内容?影响有多大?
2. **偏见风险**:训练数据或提示词是否可能导致对特定群体的不公平输出?
3. **滥用风险**:用户是否可能以非预期方式使用此功能?是否有安全绕过?
4. **数据风险**:是否涉及个人数据?是否有数据泄露的可能?
5. **合规风险**:是否触及行业监管红线?(参见 /compliance/ 合规专题)
对每个风险给出:
- 风险等级(高/中/低)
- 发生概率
- 影响程度
- 缓解措施
- 监控指标
产出记录
将 AI 返回的结果填入下方模板,形成可追踪的项目文档。
风险登记记录
项目描述:___
风险矩阵
| 风险类别 | 风险描述 | 等级 | 概率 | 影响 | 缓解措施 | 监控指标 |
|---|---|---|---|---|---|---|
| 幻觉 | ___ | 高/中/低 | ___ | ___ | ___ | ___ |
| 偏见 | ___ | 高/中/低 | ___ | ___ | ___ | ___ |
| 滥用 | ___ | 高/中/低 | ___ | ___ | ___ | ___ |
| 数据泄露 | ___ | 高/中/低 | ___ | ___ | ___ | ___ |
高风险项详情
风险 1: - 发生场景: - 缓解措施: - 责任人:
综合评估
- 整体风险等级:___
- 需要外部支持的风险:___
- 评估人 / 日期:___ / ___
查看填写示例
示例场景
【示例】风险登记——智能客服意图识别
项目描述:客服中心 AI 意图分类,7 类意图,API 调用 Qwen-Turbo
风险矩阵
| 风险类别 | 风险描述 | 等级 | 概率 | 影响 | 缓解措施 | 监控指标 |
|---|---|---|---|---|---|---|
| 幻觉 | 将投诉分类为退款(可信但错误的分类) | 中 | 中 | 中 | 置信度 < 0.6 转人工 | 误分类率 |
| 偏见 | 对粤语用户意图识别率低于普通话 | 中 | 高 | 中 | 补充粤语标注数据 | 粤语/普通话准确率差异 |
| 滥用 | 注入攻击:输入含恶意指令干扰分类 | 低 | 低 | 高 | 输入长度限制 + 关键词过滤 | 异常输入占比 |
| 数据泄露 | 电话号码未脱敏导致隐私泄露 | 中 | 低 | 高 | ASR 后自动脱敏 | 脱敏遗漏率 |
高风险项详情
风险 1(偏见风险):粤语工单覆盖度不足 - 发生场景:粤语用户来电被误分类为"其他" - 缓解措施:补充 500 条粤语标注 + 置信度阈值调低 - 责任人:张明(PM)
综合评估
- 整体风险等级:中
- 需要外部支持的风险:数据脱敏方案需信息安全团队审核
- 评估人 / 日期:张明 / 2026-04-18
自检 Checklist
- 是否覆盖了幻觉、偏见、滥用、数据四个维度?
- 每个风险是否有明确的缓解措施?
- 合规风险是否已关联到具体法规?
衍生动作
- 风险可控:进入合规扫描清单
- 高风险:评估是否需要调整项目范围或增加安全措施
作者 手记
AI 项目的风险登记册最大的价值不是文档本身,而是让团队形成"主动识别风险"的习惯。建议在开发过程中定期回顾风险登记册,特别是每次模型升级或功能变更后。