2. 定义期 · WorkKit
AI 问题框定模板
PM
把模糊的"做个 AI 功能"转化为开发团队和评测体系都能接住的规格
触发场景
当团队已经确认 AI 是正确的解法(通过适用性评估),需要把业务需求翻译成 AI 可执行的问题定义。这一步做不好,后面所有开发都是浪费。
输入清单
- ◆ AI 适用性评估报告
- ◆ 业务需求文档或口头需求描述
- ◆ 目标用户画像
- ◆ 成功指标(可量化)
▶ 提示词
你是一位 AI 产品经理。我需要把一个业务需求转化为 AI 可执行的问题定义。
业务需求:
{{BUSINESS_REQUIREMENT}}
请帮我完成以下框定:
1. **问题重述**:用 AI 术语重新描述这个需求(输入是什么、输出是什么、评判标准是什么)
2. **边界定义**:明确 AI 负责什么、人不负责什么、人机协作的交接点在哪
3. **输出规格**:输出的格式、精度要求、延迟要求
4. **失败定义**:什么样的输出算"失败",失败时怎么兜底
5. **约束条件**:数据限制、合规要求、成本上限
产出记录
将 AI 返回的结果填入下方模板,形成可追踪的项目文档。
AI 问题框定记录
业务需求原文:___
问题重述
- 输入:___
- 输出:___
- 评判标准:___
边界定义
- AI 负责:___
- 人工负责:___
- 人机协作交接点:___
输出规格
- 格式要求:___
- 精度要求:___
- 延迟要求:___
失败定义与兜底
- 失败定义:___
- 兜底方案:___
约束条件
- 数据限制:___
- 合规要求:___
- 成本上限:___
框定结论:清晰 / 需补充 评估人 / 日期:___ / ___
查看填写示例
示例场景
【示例】AI 问题框定——智能客服意图识别
业务需求原文:客服中心需要一个 AI 功能,自动识别来电用户的意图并路由到对应处理流程。
问题重述
- 输入:用户来电转写文本(ASR 输出,可能含噪声)
- 输出:意图分类标签(7 类:退款、物流、账户、投诉、产品咨询、技术支持、其他)
- 评判标准:Top-1 准确率 ≥ 85%,置信度 < 0.6 的转入人工
边界定义
- AI 负责:意图分类 + 置信度评估
- 人工负责:置信度 < 0.6 的复杂案例 + 情绪安抚
- 人机协作交接点:AI 输出置信度 → 低于阈值自动转人工,同时展示 AI 分类建议
输出规格
- 格式要求:JSON
{"intent": "refund", "confidence": 0.92} - 精度要求:Top-1 准确率 ≥ 85%,置信度校准误差 ≤ 5%
- 延迟要求:< 500ms(从文本输入到分类输出)
失败定义与兜底
- 失败定义:置信度 < 0.6 或分类为"其他"
- 兜底方案:转入人工队列,同时展示 AI 推荐的 Top-3 意图供客服参考
约束条件
- 数据限制:历史工单 2 万条,粤语/英语样本不足
- 合规要求:电话号码需脱敏后输入 AI
- 成本上限:月均 ¥3,000 Token 成本
框定结论:清晰 评估人 / 日期:张明 / 2026-04-16
自检 Checklist
- 是否明确定义了输入和输出?
- 是否有可量化的成功指标?
- 失败场景是否有兜底方案?
- 是否考虑了边缘案例?
衍生动作
- 框定清晰:进入评测集设计工序包
- 框定模糊:回到业务方补充需求细节
作者 手记
问题框定最重要的是定义"失败"。大部分团队只定义了成功长什么样,却没想过 AI 输出错误时怎么办。一个清晰的失败定义 + 兜底方案,比完美的成功定义更有价值。