YYMuse

👔 业务负责人快览仅需关注这 4 件事 ▾

⏱ 预估用时

2–4 周（含灰度观察期）

✅ 你需要做的决策

每个灰度档的推进 / 回滚决策

👥 需要提供的资源

合规终审需法务参与 · 用户告知文案需运营审核

🚨 出问题时你会看到

跳过灰度直接全量 · 合规审查放在上线后 · 没有告警通知值班人的机制

4

上线期

Launch

模型行为有概率性、有边缘案例、有不可预知的对抗输入，怎么确保上线后不出大事？

与传统项目的关键差异

AI 项目的上线不是一个开关动作，而是一个连续的灰度过程。从内部测试到小范围用户、再到全量发布，每一档之间都需要明确的观察期和回退条件。

合规终审必须作为强闸门——一旦发现红线问题，宁可推迟上线也不让带病上线，因为 AI 产品上线后的负面舆情和监管处罚成本，远超延期成本（参见 AI 合规专题）。

这一阶段需要事先准备好"出问题怎么办"的预案：模型回退机制、规则引擎兜底、人工接管流程。这些不是可选项，是 AI 产品上线的必备件。

核心交付物

灰度发布方案与回滚预案
合规终审清单（强闸门）
监控指标与告警阈值配置
上线公告与用户告知文案

常见坑

跳过灰度，直接全量发布
合规审查放在上线后，而非作为前置闸门
没有回退方案，出问题只能紧急下线
告警阈值设置过松，早期异常被忽略

阶段通过条件

上线期通过条件

满足以下所有条件方可进入运营期（全量发布）：

灰度发布各阶段均通过：内部测试 → 5% 用户 → 20% → 50%，每档至少运行 3 个工作日且无 P0/P1 问题
合规终审通过（强闸门）：合规清单所有项均为"通过"或"已缓解"，红线问题零遗留
监控与告警配置就绪：准确率、延迟、Token 消耗、异常输入四类指标均有告警阈值，且已验证告警可触达值班人
回退预案已测试：至少完成一次回退演练，确认规则引擎兜底和人工接管流程可用
用户告知已完成：上线公告和免责声明已发布，涉及数据处理的已获得用户授权

灰度发布各阶段均通过（每档 ≥ 3 个工作日）
合规终审通过（强闸门，红线零遗留）
监控与告警配置就绪，已验证触达值班人
回退预案已测试（至少一次回退演练）
用户告知已完成，涉及数据处理的已获授权

工序包

1 灰度发布与回滚预案 2 合规终审清单 3 监控指标与告警阈值 4 上线公告与免责声明 5 上线期评审卡

灰度发布与回滚预案

设计连续的灰度发布流程和可执行的回滚预案

合规终审清单

上线前的合规强闸门——带病上线的代价远超延期

监控指标与告警阈值

配置上线后的核心监控指标和告警阈值

上线公告与免责声明

准备用户告知文案、免责声明和反馈渠道

上线期评审卡

阶段门禁评审工具——确认灰度通过和合规终审后，批准全量发布

← 构建期

运营期 →