2. 定义期 · WorkKit
定义期评审卡
阶段门禁评审工具——确认评测集完备性和风险可控后,批准进入构建期
触发场景
完成定义期 4 个工序包后,在申请进入构建期前使用本评审卡。重点确认: 评测集是否足以判断"什么算合格",风险和合规是否可控。
输入清单
- ◆ AI 问题框定文档
- ◆ 评测集(含评分标准和准入线)
- ◆ 风险登记册
- ◆ 合规扫描清单
产出记录
将 AI 返回的结果填入下方模板,形成可追踪的项目文档。
定义期评审卡
项目名称: 评审日期: 主持人:___
核心问题回顾
AI 问题的定义足够清晰吗?评测标准是否可执行?
阶段结论摘要(PM 填写,业务负责人审阅)
| 维度 | 结论 | 核心依据(一句话) |
|---|---|---|
| 问题框定 | 清晰 / 需补充 | ___ |
| 评测集完备性 | 就绪 / 需补充 | ___ |
| 风险等级 | 高/中/低 | ___ |
| 合规状态 | 通过/待修复 | ___ |
门禁得分
综合得分:___ / 15(通过线 ≥ 12,无单项 ≤ 2)
决策
- [ ] ✅ Go:批准进入构建期
- [ ] ⚠️ Conditional Go:附条件推进(条件见下)
- [ ] ❌ No-Go:暂停,原因见下
附条件 / 暂停原因:___
下阶段预估投入:人力 ___ 人周,预算 ___ 元
决策人签字:(业务负责人) PM 确认:
查看填写示例
示例场景
【示例】定义期评审卡——智能客服意图识别项目
项目名称:客服中心 AI 意图识别 评审日期:2026-04-20 主持人:张明(PM)
阶段结论摘要
| 维度 | 结论 | 核心依据 |
|---|---|---|
| 问题框定 | 清晰 | 7 类意图,输入/输出/失败定义完整 |
| 评测集完备性 | 就绪 | 60 条用例,核心 67%/边缘 20%/回归 13% |
| 风险等级 | 中 | 偏见风险(粤语)可控,幻觉风险已设兜底 |
| 合规状态 | 通过 | 6 项检查全通过,无阻断项 |
门禁得分:13 / 15 ✅
决策:✅ Go
批准进入构建期,技术路线为 Prompt Engineering(先),若 < 70 分升级到 RAG。
决策人:李红(业务VP) PM 确认:张明
自检 Checklist
- 问题框定是否定义了输入/输出/失败?
- 评测集是否 ≥ 30 条且包含边缘案例?
- 风险登记是否有缓解措施?
- 合规扫描是否有明确结论?
衍生动作
- Go / Conditional Go:进入构建期,携带本评审卡和评测集作为开发输入
- No-Go:归档评审卡,补充缺失内容后重新评审
作者 手记
定义期评审卡的重点是评测集。如果评测集还没有准备好,就不要进构建期。 没有评测集的开发,就像没有图纸的施工——做得快但不一定对。