3. 构建期 · WorkKit

系统架构设计（含 HITL）

架构工程

设计包含人机协作节点和可观测性的 AI 系统架构

触发场景

技术路线确定后，需要设计系统架构。关键点：必须有 HITL（Human-in-the-Loop，人机协作）节点和 Observability（可观测性）设计。AI 系统不进入"全自动运行"模式。

输入清单

◆ 技术路线决策记录
◆ 评测集（含准入线）
◆ 风险登记册
◆ 现有系统架构图（如有）

▶ 提示词基础版 / 进阶版

你是一位 AI 系统架构师。请帮我设计包含以下要素的系统架构：

功能需求：
{{REQUIREMENTS}}

技术路线：{{TECH_ROUTE}}
规模量级：{{SCALE_TIER}}（POC / growth / scale / enterprise）

请设计：
1. **系统组件图**：数据流从输入到输出的完整路径
2. **HITL 节点**：
   - 哪些环节需要人工审核？
   - 审核的标准和流程是什么？
   - 人工审核的 SLA（多长时间内完成）
3. **Observability 设计**：
   - 关键监控指标（延迟、准确率、Token 消耗）
   - 告警阈值
   - 日志策略
4. **降级策略**：当 AI 服务不可用时的兜底方案
5. **数据流安全**：敏感数据的处理和存储方案

请用 Mermaid flowchart 格式输出系统组件图。

你是一位资深 AI 平台架构师，曾设计过多个包含人机协作（HITL）的生产级 AI 系统。请为以下场景设计完整的系统架构。

## 第一层：角色与上下文

你擅长设计"人机协作"而非"全自动"架构。你的设计原则是：AI 处理 80% 的常规请求，人工兜底 20% 的边缘案例。你同时关注流式（streaming）和批量（batch）两种架构模式的取舍。

## 第二层：输入参数

- **功能需求**：{{REQUIREMENTS}}
- **技术路线**：{{TECH_ROUTE}}
- **预估 QPS**：{{QPS}}
- **规模量级**：{{SCALE_TIER}}（可选值：POC / growth <1万DAU / scale 1万-10万DAU / enterprise >10万DAU）
- **合规要求**：{{COMPLIANCE}}

## 第三层：分析框架

### 3.1 高级 HITL 模式选择

根据业务风险等级，选择合适的 HITL 模式：

| 模式 | 适用场景 | 延迟影响 | 人工成本 |
|------|---------|---------|---------|
| **Tiered Review（分级审核）** | 高风险内容自动升级审核 | 低风险零延迟 | 仅高风险样本 |
| **Async Review（异步审核）** | 批量生成内容，非实时 | 无（事后审核） | 可排队处理 |
| **Shadow Mode（影子模式）** | AI 上线初期，人工并行处理 | 无影响 | 全量但可逐步退出 |

请根据场景推荐 HITL 模式组合，并输出 HITL 规则配置：

```yaml
hitl_config:
  mode: "tiered_review"  # tiered_review / async_review / shadow_mode
  rules:
    - name: "低置信度兜底"
      condition: "confidence < 0.6"
      action: "route_to_human"
      sla_seconds: 30
      priority: "high"
    - name: "高风险内容升级"
      condition: "intent == 'complaint' OR sentiment == 'negative'"
      action: "escalate_to_senior"
      sla_seconds: 10
      priority: "critical"
    - name: "影子模式对照"
      condition: "mode == 'shadow'"
      action: "parallel_human"
      sla_seconds: null
      priority: "low"
  fallback:
    trigger: "queue_depth > 50 OR avg_wait > 60s"
    action: "auto_approve_with_flag"
    notification: "飞书告警 + 邮件周报"
```

### 3.2 流式 vs 批量架构权衡

| 维度 | 流式架构（Streaming） | 批量架构（Batch） |
|------|---------------------|------------------|
| 延迟 | P95 < 500ms | 分钟级 |
| 适用 | 实时对话、在线分类 | 报告生成、批量标注 |
| HITL 集成 | 需要同步审核队列 | 可异步排队 |
| 成本 | 高（常驻连接） | 低（按批调度） |
| 复杂度 | 连接管理、超时处理 | 任务调度、重试机制 |

请根据场景推荐架构模式（或混合方案）。

### 3.3 系统组件设计

请设计以下组件并标注数据流：

1. **接入层**：请求路由、限流、认证
2. **AI 推理层**：模型调用、Prompt 管理、结果缓存
3. **HITL 层**：审核队列、审核界面、SLA 监控
4. **Observability 层**：指标采集（延迟/准确率/Token/成本）、告警、仪表盘
5. **降级层**：熔断器、降级策略、自动恢复

### 3.4 多模型编排（如适用）

如果技术路线包含多模型，请设计模型路由策略：
- 主模型 / 备用模型切换条件
- A/B 测试路由规则
- 模型版本灰度发布策略

## 第四层：反论自检

1. 架构中**最脆弱的单点**是什么？如何消除？
2. HITL 节点如果**人工不可用**（夜班/节假日），系统如何自保？
3. 降级方案**恢复后**如何验证质量恢复？

## 第五层：输出格式

请输出：
1. 系统架构 Mermaid 流程图（包含 HITL 节点、Observability、降级路径）
2. HITL 配置 YAML（如上模板）
3. 组件清单表格（组件名、职责、技术选型、负责团队）
4. 降级策略配置 YAML

产出记录

将 AI 返回的结果填入下方模板，形成可追踪的项目文档。

系统架构设计记录

功能需求： 技术路线：

HITL 节点清单

环节	人工审核	审核标准	SLA
___	是/否	___	___
___	是/否	___	___

Observability 设计

指标	告警阈值（Warning）	告警阈值（Critical）
延迟 P95	___	___
准确率	___	___
Token 消耗	___	___
错误率	___	___

降级策略

触发条件：___
降级方案：___
恢复条件：___

设计人 / 日期：___ / ___

系统组件流程图

将 AI 返回的 Mermaid 流程图粘贴在下方。提示词已要求 AI 以 Mermaid flowchart 格式输出。

___

查看填写示例

示例场景

【示例】系统架构设计（含 HITL）——智能客服意图识别

功能需求：来电意图自动分类，7 类意图，置信度低时转人工 技术路线：Prompt Engineering + Qwen-Turbo API

HITL 节点清单

环节	人工审核	审核标准	SLA
意图分类（置信度 < 0.6）	是	客服确认 AI 推荐的 Top-3 意图	≤ 30 秒
"其他"类意图	是	客服手动选择意图	≤ 60 秒
用户情绪激动	是（自动触发）	根据关键词检测转高级客服	≤ 10 秒

Observability 设计

指标	告警阈值（Warning）	告警阈值（Critical）
延迟 P95	> 800ms	> 2s
准确率（日采样）	< 85%	< 80%
Token 消耗	> 日均 ¥100	> 日均 ¥150
转人工率	> 25%	> 35%

降级策略

触发条件：API 连续 3 次超时或 5xx
降级方案：全部转人工队列，展示"系统繁忙"提示
恢复条件：API 连续 5 次健康检查通过

设计人 / 日期：王工 / 2026-04-22

系统组件流程图

flowchart LR A[用户来电] --> B[语音转文本
ASR 模块] B --> C[意图分类
Qwen-Turbo API] C --> D{置信度 ≥ 0.6？} D -->|是| E[自动路由
返回分类结果] D -->|否| F[人工审核队列
HITL 节点] F --> G[客服确认 Top-3
≤ 30s SLA] G --> E E --> H[业务系统
工单/FAQ/转接] C --> I[Observability
可观测性监控] D --> I I --> J{指标超阈值？} J -->|Warning| K[告警通知
飞书/钉钉] J -->|Critical| L[自动降级
全转人工队列]

自检 Checklist

架构中是否明确标注了 HITL 节点？
是否有完整的监控和告警设计？
降级策略是否可自动触发？
敏感数据是否有保护方案？

衍生动作

架构完成：进入提示词版本管理规范
架构复杂：考虑分阶段实施

作者手记

架构设计里最容易被忽视的是 Observability。没有监控的 AI 系统，就像蒙着眼开高速——等到出问题已经来不及了。建议在架构阶段就定义好关键指标和告警阈值。

← 返回构建期

触发场景

输入清单

产出记录

系统架构设计记录

HITL 节点清单

Observability 设计

降级策略

系统组件流程图

【示例】系统架构设计（含 HITL）——智能客服意图识别

HITL 节点清单

Observability 设计

降级策略

系统组件流程图

自检 Checklist

衍生动作

作者 手记

作者手记