YYMuse
2. 定义期 · WorkKit

风险登记册

PM 法务

识别和登记 AI 项目特有的风险——幻觉、偏见、滥用、数据泄露

触发场景

在定义期完成问题框定和评测集之后,主动识别 AI 项目特有的风险类别。这不是传统项目的风险管理——AI 有自己独特的风险谱。

输入清单

  • AI 问题框定文档
  • 评测集初稿
  • 数据来源清单
  • 目标用户群体描述
提示词
你是一位 AI 风险评估专家。请帮我识别以下 AI 项目的风险。

项目描述:
{{PROJECT_DESCRIPTION}}

请从以下维度分析:
1. **幻觉风险**:AI 是否可能生成虚假但看起来可信的内容?影响有多大?
2. **偏见风险**:训练数据或提示词是否可能导致对特定群体的不公平输出?
3. **滥用风险**:用户是否可能以非预期方式使用此功能?是否有安全绕过?
4. **数据风险**:是否涉及个人数据?是否有数据泄露的可能?
5. **合规风险**:是否触及行业监管红线?(参见 /compliance/ 合规专题)

对每个风险给出:
- 风险等级(高/中/低)
- 发生概率
- 影响程度
- 缓解措施
- 监控指标

产出记录

将 AI 返回的结果填入下方模板,形成可追踪的项目文档。

风险登记记录

项目描述:___

风险矩阵

风险类别 风险描述 等级 概率 影响 缓解措施 监控指标
幻觉 ___ 高/中/低 ___ ___ ___ ___
偏见 ___ 高/中/低 ___ ___ ___ ___
滥用 ___ 高/中/低 ___ ___ ___ ___
数据泄露 ___ 高/中/低 ___ ___ ___ ___

高风险项详情

风险 1 - 发生场景: - 缓解措施: - 责任人:

综合评估

  • 整体风险等级:___
  • 需要外部支持的风险:___
  • 评估人 / 日期:___ / ___
查看填写示例
示例场景

【示例】风险登记——智能客服意图识别

项目描述:客服中心 AI 意图分类,7 类意图,API 调用 Qwen-Turbo

风险矩阵

风险类别 风险描述 等级 概率 影响 缓解措施 监控指标
幻觉 将投诉分类为退款(可信但错误的分类) 置信度 < 0.6 转人工 误分类率
偏见 对粤语用户意图识别率低于普通话 补充粤语标注数据 粤语/普通话准确率差异
滥用 注入攻击:输入含恶意指令干扰分类 输入长度限制 + 关键词过滤 异常输入占比
数据泄露 电话号码未脱敏导致隐私泄露 ASR 后自动脱敏 脱敏遗漏率

高风险项详情

风险 1(偏见风险):粤语工单覆盖度不足 - 发生场景:粤语用户来电被误分类为"其他" - 缓解措施:补充 500 条粤语标注 + 置信度阈值调低 - 责任人:张明(PM)

综合评估

  • 整体风险等级:中
  • 需要外部支持的风险:数据脱敏方案需信息安全团队审核
  • 评估人 / 日期:张明 / 2026-04-18

自检 Checklist

  • 是否覆盖了幻觉、偏见、滥用、数据四个维度?
  • 每个风险是否有明确的缓解措施?
  • 合规风险是否已关联到具体法规?

衍生动作

  • 风险可控:进入合规扫描清单
  • 高风险:评估是否需要调整项目范围或增加安全措施

作者 手记

AI 项目的风险登记册最大的价值不是文档本身,而是让团队形成"主动识别风险"的习惯。建议在开发过程中定期回顾风险登记册,特别是每次模型升级或功能变更后。

← 返回 定义期