YYMuse
首页AI 项目交付指南 › 上线期
👔 业务负责人快览 仅需关注这 4 件事 ▾
⏱ 预估用时
2–4 周(含灰度观察期)
✅ 你需要做的决策
每个灰度档的推进 / 回滚决策
👥 需要提供的资源
合规终审需法务参与 · 用户告知文案需运营审核
🚨 出问题时你会看到
跳过灰度直接全量 · 合规审查放在上线后 · 没有告警通知值班人的机制
4

上线期

Launch

模型行为有概率性、有边缘案例、有不可预知的对抗输入,怎么确保上线后不出大事?

与传统项目的关键差异

AI 项目的上线不是一个开关动作,而是一个连续的灰度过程。从内部测试到小范围用户、再到全量发布,每一档之间都需要明确的观察期和回退条件。

合规终审必须作为强闸门——一旦发现红线问题,宁可推迟上线也不让带病上线,因为 AI 产品上线后的负面舆情和监管处罚成本,远超延期成本(参见 AI 合规专题)。

这一阶段需要事先准备好"出问题怎么办"的预案:模型回退机制、规则引擎兜底、人工接管流程。这些不是可选项,是 AI 产品上线的必备件。

核心交付物

  • 灰度发布方案与回滚预案
  • 合规终审清单(强闸门)
  • 监控指标与告警阈值配置
  • 上线公告与用户告知文案

常见坑

  • 跳过灰度,直接全量发布
  • 合规审查放在上线后,而非作为前置闸门
  • 没有回退方案,出问题只能紧急下线
  • 告警阈值设置过松,早期异常被忽略

阶段通过条件

上线期通过条件

满足以下所有条件方可进入运营期(全量发布):

  • 灰度发布各阶段均通过:内部测试 → 5% 用户 → 20% → 50%,每档至少运行 3 个工作日且无 P0/P1 问题
  • 合规终审通过(强闸门):合规清单所有项均为"通过"或"已缓解",红线问题零遗留
  • 监控与告警配置就绪:准确率、延迟、Token 消耗、异常输入四类指标均有告警阈值,且已验证告警可触达值班人
  • 回退预案已测试:至少完成一次回退演练,确认规则引擎兜底和人工接管流程可用
  • 用户告知已完成:上线公告和免责声明已发布,涉及数据处理的已获得用户授权
  • 灰度发布各阶段均通过(每档 ≥ 3 个工作日)
  • 合规终审通过(强闸门,红线零遗留)
  • 监控与告警配置就绪,已验证触达值班人
  • 回退预案已测试(至少一次回退演练)
  • 用户告知已完成,涉及数据处理的已获授权

工序包

1 灰度发布与回滚预案 2 合规终审清单 3 监控指标与告警阈值 4 上线公告与免责声明 5 上线期评审卡
灰度发布与回滚预案
设计连续的灰度发布流程和可执行的回滚预案
合规终审清单
上线前的合规强闸门——带病上线的代价远超延期
监控指标与告警阈值
配置上线后的核心监控指标和告警阈值
上线公告与免责声明
准备用户告知文案、免责声明和反馈渠道
上线期评审卡
阶段门禁评审工具——确认灰度通过和合规终审后,批准全量发布
← 构建期
运营期 →