2. 定义期 · WorkKit

AI 问题框定模板

把模糊的"做个 AI 功能"转化为开发团队和评测体系都能接住的规格

触发场景

当团队已经确认 AI 是正确的解法（通过适用性评估），需要把业务需求翻译成 AI 可执行的问题定义。这一步做不好，后面所有开发都是浪费。

输入清单

◆ AI 适用性评估报告
◆ 业务需求文档或口头需求描述
◆ 目标用户画像
◆ 成功指标（可量化）

▶ 提示词

你是一位 AI 产品经理。我需要把一个业务需求转化为 AI 可执行的问题定义。

业务需求：
{{BUSINESS_REQUIREMENT}}

请帮我完成以下框定：
1. **问题重述**：用 AI 术语重新描述这个需求（输入是什么、输出是什么、评判标准是什么）
2. **边界定义**：明确 AI 负责什么、人不负责什么、人机协作的交接点在哪
3. **输出规格**：输出的格式、精度要求、延迟要求
4. **失败定义**：什么样的输出算"失败"，失败时怎么兜底
5. **约束条件**：数据限制、合规要求、成本上限

产出记录

将 AI 返回的结果填入下方模板，形成可追踪的项目文档。

AI 问题框定记录

业务需求原文：___

问题重述

输入：___
输出：___
评判标准：___

边界定义

AI 负责：___
人工负责：___
人机协作交接点：___

输出规格

格式要求：___
精度要求：___
延迟要求：___

失败定义与兜底

失败定义：___
兜底方案：___

约束条件

数据限制：___
合规要求：___
成本上限：___

框定结论：清晰 / 需补充 评估人 / 日期：___ / ___

查看填写示例

示例场景

【示例】AI 问题框定——智能客服意图识别

业务需求原文：客服中心需要一个 AI 功能，自动识别来电用户的意图并路由到对应处理流程。

问题重述

输入：用户来电转写文本（ASR 输出，可能含噪声）
输出：意图分类标签（7 类：退款、物流、账户、投诉、产品咨询、技术支持、其他）
评判标准：Top-1 准确率 ≥ 85%，置信度 < 0.6 的转入人工

边界定义

AI 负责：意图分类 + 置信度评估
人工负责：置信度 < 0.6 的复杂案例 + 情绪安抚
人机协作交接点：AI 输出置信度 → 低于阈值自动转人工，同时展示 AI 分类建议

输出规格

格式要求：JSON {"intent": "refund", "confidence": 0.92}
精度要求：Top-1 准确率 ≥ 85%，置信度校准误差 ≤ 5%
延迟要求：< 500ms（从文本输入到分类输出）

失败定义与兜底

失败定义：置信度 < 0.6 或分类为"其他"
兜底方案：转入人工队列，同时展示 AI 推荐的 Top-3 意图供客服参考

约束条件

数据限制：历史工单 2 万条，粤语/英语样本不足
合规要求：电话号码需脱敏后输入 AI
成本上限：月均 ¥3,000 Token 成本

框定结论：清晰 评估人 / 日期：张明 / 2026-04-16

自检 Checklist

是否明确定义了输入和输出？
是否有可量化的成功指标？
失败场景是否有兜底方案？
是否考虑了边缘案例？

衍生动作

框定清晰：进入评测集设计工序包
框定模糊：回到业务方补充需求细节

作者手记

问题框定最重要的是定义"失败"。大部分团队只定义了成功长什么样，却没想过 AI 输出错误时怎么办。一个清晰的失败定义 + 兜底方案，比完美的成功定义更有价值。

← 返回定义期

触发场景

输入清单

产出记录

AI 问题框定记录

问题重述

边界定义

输出规格

失败定义与兜底

约束条件

【示例】AI 问题框定——智能客服意图识别

问题重述

边界定义

输出规格

失败定义与兜底

约束条件

自检 Checklist

衍生动作

作者 手记

作者手记