YYMuse
2. 定义期 · WorkKit

AI 问题框定模板

PM

把模糊的"做个 AI 功能"转化为开发团队和评测体系都能接住的规格

触发场景

当团队已经确认 AI 是正确的解法(通过适用性评估),需要把业务需求翻译成 AI 可执行的问题定义。这一步做不好,后面所有开发都是浪费。

输入清单

  • AI 适用性评估报告
  • 业务需求文档或口头需求描述
  • 目标用户画像
  • 成功指标(可量化)
提示词
你是一位 AI 产品经理。我需要把一个业务需求转化为 AI 可执行的问题定义。

业务需求:
{{BUSINESS_REQUIREMENT}}

请帮我完成以下框定:
1. **问题重述**:用 AI 术语重新描述这个需求(输入是什么、输出是什么、评判标准是什么)
2. **边界定义**:明确 AI 负责什么、人不负责什么、人机协作的交接点在哪
3. **输出规格**:输出的格式、精度要求、延迟要求
4. **失败定义**:什么样的输出算"失败",失败时怎么兜底
5. **约束条件**:数据限制、合规要求、成本上限

产出记录

将 AI 返回的结果填入下方模板,形成可追踪的项目文档。

AI 问题框定记录

业务需求原文:___

问题重述

  • 输入:___
  • 输出:___
  • 评判标准:___

边界定义

  • AI 负责:___
  • 人工负责:___
  • 人机协作交接点:___

输出规格

  • 格式要求:___
  • 精度要求:___
  • 延迟要求:___

失败定义与兜底

  • 失败定义:___
  • 兜底方案:___

约束条件

  • 数据限制:___
  • 合规要求:___
  • 成本上限:___

框定结论:清晰 / 需补充 评估人 / 日期:___ / ___

查看填写示例
示例场景

【示例】AI 问题框定——智能客服意图识别

业务需求原文:客服中心需要一个 AI 功能,自动识别来电用户的意图并路由到对应处理流程。

问题重述

  • 输入:用户来电转写文本(ASR 输出,可能含噪声)
  • 输出:意图分类标签(7 类:退款、物流、账户、投诉、产品咨询、技术支持、其他)
  • 评判标准:Top-1 准确率 ≥ 85%,置信度 < 0.6 的转入人工

边界定义

  • AI 负责:意图分类 + 置信度评估
  • 人工负责:置信度 < 0.6 的复杂案例 + 情绪安抚
  • 人机协作交接点:AI 输出置信度 → 低于阈值自动转人工,同时展示 AI 分类建议

输出规格

  • 格式要求:JSON {"intent": "refund", "confidence": 0.92}
  • 精度要求:Top-1 准确率 ≥ 85%,置信度校准误差 ≤ 5%
  • 延迟要求:< 500ms(从文本输入到分类输出)

失败定义与兜底

  • 失败定义:置信度 < 0.6 或分类为"其他"
  • 兜底方案:转入人工队列,同时展示 AI 推荐的 Top-3 意图供客服参考

约束条件

  • 数据限制:历史工单 2 万条,粤语/英语样本不足
  • 合规要求:电话号码需脱敏后输入 AI
  • 成本上限:月均 ¥3,000 Token 成本

框定结论:清晰 评估人 / 日期:张明 / 2026-04-16

自检 Checklist

  • 是否明确定义了输入和输出?
  • 是否有可量化的成功指标?
  • 失败场景是否有兜底方案?
  • 是否考虑了边缘案例?

衍生动作

  • 框定清晰:进入评测集设计工序包
  • 框定模糊:回到业务方补充需求细节

作者 手记

问题框定最重要的是定义"失败"。大部分团队只定义了成功长什么样,却没想过 AI 输出错误时怎么办。一个清晰的失败定义 + 兜底方案,比完美的成功定义更有价值。

← 返回 定义期