4
上线期
Launch模型行为有概率性、有边缘案例、有不可预知的对抗输入,怎么确保上线后不出大事?
与传统项目的关键差异
AI 项目的上线不是一个开关动作,而是一个连续的灰度过程。从内部测试到小范围用户、再到全量发布,每一档之间都需要明确的观察期和回退条件。
合规终审必须作为强闸门——一旦发现红线问题,宁可推迟上线也不让带病上线,因为 AI 产品上线后的负面舆情和监管处罚成本,远超延期成本(参见 AI 合规专题)。
这一阶段需要事先准备好"出问题怎么办"的预案:模型回退机制、规则引擎兜底、人工接管流程。这些不是可选项,是 AI 产品上线的必备件。
核心交付物
- 灰度发布方案与回滚预案
- 合规终审清单(强闸门)
- 监控指标与告警阈值配置
- 上线公告与用户告知文案
常见坑
- 跳过灰度,直接全量发布
- 合规审查放在上线后,而非作为前置闸门
- 没有回退方案,出问题只能紧急下线
- 告警阈值设置过松,早期异常被忽略
阶段通过条件
上线期通过条件
满足以下所有条件方可进入运营期(全量发布):
- 灰度发布各阶段均通过:内部测试 → 5% 用户 → 20% → 50%,每档至少运行 3 个工作日且无 P0/P1 问题
- 合规终审通过(强闸门):合规清单所有项均为"通过"或"已缓解",红线问题零遗留
- 监控与告警配置就绪:准确率、延迟、Token 消耗、异常输入四类指标均有告警阈值,且已验证告警可触达值班人
- 回退预案已测试:至少完成一次回退演练,确认规则引擎兜底和人工接管流程可用
- 用户告知已完成:上线公告和免责声明已发布,涉及数据处理的已获得用户授权
- 灰度发布各阶段均通过(每档 ≥ 3 个工作日)
- 合规终审通过(强闸门,红线零遗留)
- 监控与告警配置就绪,已验证触达值班人
- 回退预案已测试(至少一次回退演练)
- 用户告知已完成,涉及数据处理的已获授权