3. 构建期 · WorkKit
系统架构设计(含 HITL)
架构
工程
设计包含人机协作节点和可观测性的 AI 系统架构
触发场景
技术路线确定后,需要设计系统架构。关键点:必须有 HITL(Human-in-the-Loop,人机协作)节点和 Observability(可观测性)设计。AI 系统不进入"全自动运行"模式。
输入清单
- ◆ 技术路线决策记录
- ◆ 评测集(含准入线)
- ◆ 风险登记册
- ◆ 现有系统架构图(如有)
▶ 提示词 基础版 / 进阶版
你是一位 AI 系统架构师。请帮我设计包含以下要素的系统架构:
功能需求:
{{REQUIREMENTS}}
技术路线:{{TECH_ROUTE}}
规模量级:{{SCALE_TIER}}(POC / growth / scale / enterprise)
请设计:
1. **系统组件图**:数据流从输入到输出的完整路径
2. **HITL 节点**:
- 哪些环节需要人工审核?
- 审核的标准和流程是什么?
- 人工审核的 SLA(多长时间内完成)
3. **Observability 设计**:
- 关键监控指标(延迟、准确率、Token 消耗)
- 告警阈值
- 日志策略
4. **降级策略**:当 AI 服务不可用时的兜底方案
5. **数据流安全**:敏感数据的处理和存储方案
请用 Mermaid flowchart 格式输出系统组件图。
产出记录
将 AI 返回的结果填入下方模板,形成可追踪的项目文档。
系统架构设计记录
功能需求: 技术路线:
HITL 节点清单
| 环节 | 人工审核 | 审核标准 | SLA |
|---|---|---|---|
| ___ | 是/否 | ___ | ___ |
| ___ | 是/否 | ___ | ___ |
Observability 设计
| 指标 | 告警阈值(Warning) | 告警阈值(Critical) |
|---|---|---|
| 延迟 P95 | ___ | ___ |
| 准确率 | ___ | ___ |
| Token 消耗 | ___ | ___ |
| 错误率 | ___ | ___ |
降级策略
- 触发条件:___
- 降级方案:___
- 恢复条件:___
设计人 / 日期:___ / ___
系统组件流程图
将 AI 返回的 Mermaid 流程图粘贴在下方。提示词已要求 AI 以 Mermaid flowchart 格式输出。
___
查看填写示例
示例场景
【示例】系统架构设计(含 HITL)——智能客服意图识别
功能需求:来电意图自动分类,7 类意图,置信度低时转人工 技术路线:Prompt Engineering + Qwen-Turbo API
HITL 节点清单
| 环节 | 人工审核 | 审核标准 | SLA |
|---|---|---|---|
| 意图分类(置信度 < 0.6) | 是 | 客服确认 AI 推荐的 Top-3 意图 | ≤ 30 秒 |
| "其他"类意图 | 是 | 客服手动选择意图 | ≤ 60 秒 |
| 用户情绪激动 | 是(自动触发) | 根据关键词检测转高级客服 | ≤ 10 秒 |
Observability 设计
| 指标 | 告警阈值(Warning) | 告警阈值(Critical) |
|---|---|---|
| 延迟 P95 | > 800ms | > 2s |
| 准确率(日采样) | < 85% | < 80% |
| Token 消耗 | > 日均 ¥100 | > 日均 ¥150 |
| 转人工率 | > 25% | > 35% |
降级策略
- 触发条件:API 连续 3 次超时或 5xx
- 降级方案:全部转人工队列,展示"系统繁忙"提示
- 恢复条件:API 连续 5 次健康检查通过
设计人 / 日期:王工 / 2026-04-22
系统组件流程图
flowchart LR
A[用户来电] --> B[语音转文本
ASR 模块] B --> C[意图分类
Qwen-Turbo API] C --> D{置信度 ≥ 0.6?} D -->|是| E[自动路由
返回分类结果] D -->|否| F[人工审核队列
HITL 节点] F --> G[客服确认 Top-3
≤ 30s SLA] G --> E E --> H[业务系统
工单/FAQ/转接] C --> I[Observability
可观测性监控] D --> I I --> J{指标超阈值?} J -->|Warning| K[告警通知
飞书/钉钉] J -->|Critical| L[自动降级
全转人工队列]
ASR 模块] B --> C[意图分类
Qwen-Turbo API] C --> D{置信度 ≥ 0.6?} D -->|是| E[自动路由
返回分类结果] D -->|否| F[人工审核队列
HITL 节点] F --> G[客服确认 Top-3
≤ 30s SLA] G --> E E --> H[业务系统
工单/FAQ/转接] C --> I[Observability
可观测性监控] D --> I I --> J{指标超阈值?} J -->|Warning| K[告警通知
飞书/钉钉] J -->|Critical| L[自动降级
全转人工队列]
自检 Checklist
- 架构中是否明确标注了 HITL 节点?
- 是否有完整的监控和告警设计?
- 降级策略是否可自动触发?
- 敏感数据是否有保护方案?
衍生动作
- 架构完成:进入提示词版本管理规范
- 架构复杂:考虑分阶段实施
作者 手记
架构设计里最容易被忽视的是 Observability。没有监控的 AI 系统,就像蒙着眼开高速——等到出问题已经来不及了。建议在架构阶段就定义好关键指标和告警阈值。