YYMuse
3. 构建期 · WorkKit

系统架构设计(含 HITL)

架构 工程

设计包含人机协作节点和可观测性的 AI 系统架构

触发场景

技术路线确定后,需要设计系统架构。关键点:必须有 HITL(Human-in-the-Loop,人机协作)节点和 Observability(可观测性)设计。AI 系统不进入"全自动运行"模式。

输入清单

  • 技术路线决策记录
  • 评测集(含准入线)
  • 风险登记册
  • 现有系统架构图(如有)
提示词 基础版 / 进阶版
你是一位 AI 系统架构师。请帮我设计包含以下要素的系统架构:

功能需求:
{{REQUIREMENTS}}

技术路线:{{TECH_ROUTE}}
规模量级:{{SCALE_TIER}}(POC / growth / scale / enterprise)

请设计:
1. **系统组件图**:数据流从输入到输出的完整路径
2. **HITL 节点**:
   - 哪些环节需要人工审核?
   - 审核的标准和流程是什么?
   - 人工审核的 SLA(多长时间内完成)
3. **Observability 设计**:
   - 关键监控指标(延迟、准确率、Token 消耗)
   - 告警阈值
   - 日志策略
4. **降级策略**:当 AI 服务不可用时的兜底方案
5. **数据流安全**:敏感数据的处理和存储方案

请用 Mermaid flowchart 格式输出系统组件图。

产出记录

将 AI 返回的结果填入下方模板,形成可追踪的项目文档。

系统架构设计记录

功能需求 技术路线

HITL 节点清单

环节 人工审核 审核标准 SLA
___ 是/否 ___ ___
___ 是/否 ___ ___

Observability 设计

指标 告警阈值(Warning) 告警阈值(Critical)
延迟 P95 ___ ___
准确率 ___ ___
Token 消耗 ___ ___
错误率 ___ ___

降级策略

  • 触发条件:___
  • 降级方案:___
  • 恢复条件:___

设计人 / 日期:___ / ___

系统组件流程图

将 AI 返回的 Mermaid 流程图粘贴在下方。提示词已要求 AI 以 Mermaid flowchart 格式输出。

___
查看填写示例
示例场景

【示例】系统架构设计(含 HITL)——智能客服意图识别

功能需求:来电意图自动分类,7 类意图,置信度低时转人工 技术路线:Prompt Engineering + Qwen-Turbo API

HITL 节点清单

环节 人工审核 审核标准 SLA
意图分类(置信度 < 0.6) 客服确认 AI 推荐的 Top-3 意图 ≤ 30 秒
"其他"类意图 客服手动选择意图 ≤ 60 秒
用户情绪激动 是(自动触发) 根据关键词检测转高级客服 ≤ 10 秒

Observability 设计

指标 告警阈值(Warning) 告警阈值(Critical)
延迟 P95 > 800ms > 2s
准确率(日采样) < 85% < 80%
Token 消耗 > 日均 ¥100 > 日均 ¥150
转人工率 > 25% > 35%

降级策略

  • 触发条件:API 连续 3 次超时或 5xx
  • 降级方案:全部转人工队列,展示"系统繁忙"提示
  • 恢复条件:API 连续 5 次健康检查通过

设计人 / 日期:王工 / 2026-04-22

系统组件流程图

flowchart LR A[用户来电] --> B[语音转文本
ASR 模块] B --> C[意图分类
Qwen-Turbo API] C --> D{置信度 ≥ 0.6?} D -->|是| E[自动路由
返回分类结果] D -->|否| F[人工审核队列
HITL 节点] F --> G[客服确认 Top-3
≤ 30s SLA] G --> E E --> H[业务系统
工单/FAQ/转接] C --> I[Observability
可观测性监控] D --> I I --> J{指标超阈值?} J -->|Warning| K[告警通知
飞书/钉钉] J -->|Critical| L[自动降级
全转人工队列]

自检 Checklist

  • 架构中是否明确标注了 HITL 节点?
  • 是否有完整的监控和告警设计?
  • 降级策略是否可自动触发?
  • 敏感数据是否有保护方案?

衍生动作

  • 架构完成:进入提示词版本管理规范
  • 架构复杂:考虑分阶段实施

作者 手记

架构设计里最容易被忽视的是 Observability。没有监控的 AI 系统,就像蒙着眼开高速——等到出问题已经来不及了。建议在架构阶段就定义好关键指标和告警阈值。

← 返回 构建期