YYMuse
2. 定义期 · WorkKit

定义期评审卡

阶段门禁评审工具——确认评测集完备性和风险可控后,批准进入构建期

触发场景

完成定义期 4 个工序包后,在申请进入构建期前使用本评审卡。重点确认: 评测集是否足以判断"什么算合格",风险和合规是否可控。

输入清单

  • AI 问题框定文档
  • 评测集(含评分标准和准入线)
  • 风险登记册
  • 合规扫描清单

产出记录

将 AI 返回的结果填入下方模板,形成可追踪的项目文档。

定义期评审卡

项目名称 评审日期 主持人:___

核心问题回顾

AI 问题的定义足够清晰吗?评测标准是否可执行?

阶段结论摘要(PM 填写,业务负责人审阅)

维度 结论 核心依据(一句话)
问题框定 清晰 / 需补充 ___
评测集完备性 就绪 / 需补充 ___
风险等级 高/中/低 ___
合规状态 通过/待修复 ___

门禁得分

综合得分:___ / 15(通过线 ≥ 12,无单项 ≤ 2)

决策

  • [ ] ✅ Go:批准进入构建期
  • [ ] ⚠️ Conditional Go:附条件推进(条件见下)
  • [ ] ❌ No-Go:暂停,原因见下

附条件 / 暂停原因:___

下阶段预估投入:人力 ___ 人周,预算 ___ 元

决策人签字(业务负责人)  PM 确认

查看填写示例
示例场景

【示例】定义期评审卡——智能客服意图识别项目

项目名称:客服中心 AI 意图识别 评审日期:2026-04-20 主持人:张明(PM)

阶段结论摘要

维度 结论 核心依据
问题框定 清晰 7 类意图,输入/输出/失败定义完整
评测集完备性 就绪 60 条用例,核心 67%/边缘 20%/回归 13%
风险等级 偏见风险(粤语)可控,幻觉风险已设兜底
合规状态 通过 6 项检查全通过,无阻断项

门禁得分:13 / 15 ✅

决策:✅ Go

批准进入构建期,技术路线为 Prompt Engineering(先),若 < 70 分升级到 RAG。

决策人:李红(业务VP)  PM 确认:张明

自检 Checklist

  • 问题框定是否定义了输入/输出/失败?
  • 评测集是否 ≥ 30 条且包含边缘案例?
  • 风险登记是否有缓解措施?
  • 合规扫描是否有明确结论?

衍生动作

  • Go / Conditional Go:进入构建期,携带本评审卡和评测集作为开发输入
  • No-Go:归档评审卡,补充缺失内容后重新评审

作者 手记

定义期评审卡的重点是评测集。如果评测集还没有准备好,就不要进构建期。 没有评测集的开发,就像没有图纸的施工——做得快但不一定对。

← 返回 定义期