YYMuse

郑总和一本还没写完的账

2026-04-30 · AI Agent故事

郑建华的办公桌是一张老式的实木写字台,1994 年厂里第一批统一采购的办公家具。

三十年了,桌面被磨出了一层暗色的包浆。左上角压着一张照片——黑白的,有些泛黄。照片里十来个人站在一台大型设备前,胸口别着红花,最左边那个年轻的就是郑建华,24 岁,刚进厂两年。1994 年,华岳精密第一条引进产线投产时的合影。

照片右边多了两张便签。一张是上周的 Agent 运营周报——本月份 token 消耗 12.7 万元,V-2 订单处理 Agent 的 ROI 为正(节省人工成本 18.3 万),T-1 文档处理系统的 ROI 为负(投入 6.2 万,节省 2.1 万),V-1 视觉质检 Agent 处于盈亏平衡线。便签下方还有一行小字备注:"V-2 凌晨 3 点延迟问题已定位(模型热更新窗口),正在评估优化方案。"另一张便签是他手写的备注:"T-1 需重新评估范围和成本结构。"

两张便签贴在那张 1994 年的老照片旁边,像两个时空叠在一起。


郑建华的履历表是一条完整的上升线:1992 年进厂当技术员,1998 年当设备工程师,2004 年当产线主管,2009 年当车间主任,2016 年升副总经理,分管生产和数字化转型。

这条线的意思是他干过厂里几乎每一个岗位——设备调试他干过,产线管理他干过,车间调度他管过,安全评审他参与过,质量事故他处理过,老师傅的退休和年轻人的培训他安排过。

他不写代码。他上一次碰编程语言是 1998 年用 PLC 梯形图调一台加工中心。但他知道一件事——建一座工厂需要什么。

需要设备工程师、产线主管、维护班组长、质量管理员、安全工程师、中控调度员、关键工位老师傅,还有盯着总账的人。缺了任何一个,这座厂都开不起来——不是因为别的岗位不重要,是因为每个岗位管的是"工厂"这个系统的不同切面,这些切面合在一起才是一个完整的工厂。

去年夏天,他在季度会上宣布了一件事:华岳精密要在三年内,改造成一家 AI 辅助运营的工厂。

消息公布的时候,会场没什么反应。大家听过太多类似的话。但这一次不一样。半年过去,厂里开始出现一些以前没见过的东西。


八个工位

郑建华不是那种"拍脑袋"的领导。他的做法是——先看清楚自己在建什么,再决定怎么建。

他花了半年时间,看清楚了八件事。每件事对应一个工位、一个人。

第一件:Agent 是设备,不是软件。 老周教会他的。老周用调设备的那套方法调 Agent,比 IT 部的工程师还系统——抄参数、跑基线、建故障模式库、分级授权。郑建华看到老周那本泛黄的病历本时,意识到一件事:厂里需要的不是"AI 工程师",是需要有人把 Agent 当设备来管。老周就是这个人。

第二件:多 Agent 协作的关键是衔接,不是单体。 李雯教会他的。李雯把五个 Agent 串成一条产线,第一天就卡在衔接处。她用排产线的办法解决了——缓冲区、异常路由、节拍匹配。郑建华看到李雯墙上那张节拍图时,想的是:如果每个 Agent 是一台设备,那多 Agent 协作就是一条产线。管产线的手艺,AI 项目里一样用得上。

第三件:真正决定系统稳定性的是那些没人看见的支撑 Agent。 张师傅教会他的。主 Agent 上新闻,十三个 support agents 每天在出故障——张师傅用管设备的办法给它们建台账、定巡检周期、建依赖关系图。郑建华让 IT 部给张师傅开了独立监控权限之后,心里记了一笔:一座工厂的稳定性,从来不是由主产线决定的,是由那些不起眼的辅助系统决定的。

第四件:没有 QA 的系统,本质上是运气管理。 陈姐教会他的。陈姐那本活页夹——《Agent 质量评估手册 v0.1》——让郑建华意识到,厂里之前对 Agent 质量的管理全靠个人自觉。老周自觉建了基线,张师傅自觉建了台账。如果他们不做,没有人会做。这不是体系,是运气。陈姐把"运气管理"变成了"质量管理",用的是工厂里用了一百年的那套 QA 逻辑。

第五件:安全不是出了事再补,是动工之前就定好红线。 王工教会他的。王工拔掉测试环境网线的那天,郑建华没有批评他——他心里清楚,王工做对了。一个能在测试环境访问财务数据的 Agent,如果带着同样的权限上了生产环境,后果不堪设想。王工的"AI 版 HAZOP"让郑建华确认了一件事:AI 安全不是补丁,是准入门槛。

第六件:没有可观测性的 Agent 系统,本质上是开盲盒。 小刘教会他的。小刘自己拼出来的那块仪表盘,在上线第一天就发现了 V-2 凌晨 3 点的延迟尖峰。如果那块屏不存在,这个问题可能要等到某天凌晨突发故障才会被发现。郑建华看到小刘桌上那五杯咖啡时,想的是:工厂里没人会问"要不要上 MES",但 Agent 项目里 observability 常被当作 nice-to-have。这是认知差距,不是技术差距。

第七件:人不是系统的 fallback,是系统的一部分。 吴师傅教会他的。吴师傅那个"看三年,动手三年,独立三年"的带徒弟方式,被他用在了 Human in the Loop 的设计上——不是简单地加"确认按钮",是从"出错了谁负责、谁能兜住"的角度决定哪些节点必须留人。郑建华派方远去跟吴师傅学这件事,不是因为方远不懂技术,是因为他太懂技术了——越懂技术的人,越容易觉得所有事都能自动化。需要有人提醒他,有些事不该。


一本账

八件事看清楚之后,郑建华知道自己面对的不是七个技术问题,是一个管理问题:怎么把七个工位的人和能力,组装成一座能运行的工厂。

他做的第一件事是——算账。

不是什么战略层面的"数字化转型 ROI"——那种东西都是 PPT 上的数字。他要算的是每一笔具体的钱。

他让小刘在仪表盘的 Cost 区加了一项新内容:每个 Agent 的月度运营成本和对应的人工成本节省。不是估算,是实算——token 消耗按实际账单,人工节省按被替代的工时和对应的工资。

第一个月的数字出来:

  • V-1 视觉质检:运营成本 1.2 万/月,人工节省 2.8 万/月。ROI 为正。但前提是——老周那套基线测试和分级授权持续运行,不然一次质量事故的赔偿可能把半年的节省全吞掉。
  • V-2 订单处理:运营成本 3.4 万/月,人工节省 5.1 万/月。ROI 为正。但李雯的产线节拍还在调优,异常路由比例偏高——每笔走人工的订单增加 8 分钟处理时间。
  • T-1 文档处理(含 S-1 到 S-13):运营成本 6.2 万/月,人工节省 2.1 万/月。ROI 为负。张师傅的十三个 support agents 每天在出故障,维护成本被严重低估。
  • 其他 Agent(V-3、T-2 等):还在测试阶段,暂不计入。

郑建华看着这些数字,在便签上写了四个字:"能算清账。"

这是他最在意的事——不是每个 Agent 都必须盈利,但每个 Agent 的成本和收益必须看得见。看不见的东西管不了——这是小刘说的。郑建华把这句话扩大了一圈:看不见的东西管不了,算不清的账做不了决策。


三个关卡

算清了账之后,郑建华做了第二件事——设关卡。

他给厂里所有 Agent 项目定了三个关卡:

第一关:PoC(概念验证)→ 试运行。 条件是——完成老周那套基线测试和故障模式库,通过陈姐的质量评审,通过王工的安全评审。三个评审缺一不可。过不了关的,停掉或者重做。

第二关:试运行 → 正式运营。 条件是——连续运行 90 天无重大故障、ROI 为正或战略性亏损有明确理由、李雯的产线节拍调优完成、张师傅的维护台账建好。任何一个条件不满足,继续试运行。

第三关:正式运营 → 稳态运营。 条件是——小刘的仪表盘覆盖全部运行指标、陈姐的质量监控从"抽样"升级到"持续"、王工的安全评审从"准入"升级到"周期复评"、吴师傅的 Human in the Loop 节点评估完成首次复评。

三道关卡,每道都对应一个工位的能力。不是郑建华发明出来的——工厂里新设备从进厂到正式投产,走的也是类似的流程。他只是把这套流程翻译了一下。


一座工厂

有天晚上,郑建华一个人留在办公室。桌上那张 1994 年的老照片在台灯下泛着暖光。照片里的那台引进产线,后来被更新了两次。照片里站在最右边的那位老师傅,已经退休十五年了。照片里的郑建华 24 岁,刚学会什么叫"生产"。

他翻开了桌上的一份文件——他自己写的,标题是《华岳精密 AI 辅助运营三年规划(2025-2028)》。第一页写着他去年夏天在季度会上说的那句话:"三年内,把华岳精密改造成一家 AI 辅助运营的工厂。"

现在一年过去了。工厂里多了八个人在做八件以前不存在的事。老周在造设备、李雯在排产线、张师傅在做维护、陈姐在管质量、王工在守安全、小刘在看仪表盘、吴师傅在决定哪些活儿得留给人。

他们加在一起,才是一座完整的"Agent 工厂"。

郑建华在三年规划的空白处写了一行字:

一座工厂需要的不是最先进的设备,是每个工位上都有对的人在对的岗位上做对的事。

这座工厂也一样。

他看了看桌上那张老照片,又看了看旁边那两张便签——一张是 Agent 运营周报,一张是他对 T-1 的重新评估备注。1994 年,他用三年学会了什么叫生产。2026 年,他在用三年学会什么叫 AI 运营。"我不需要最先进的,我需要能跑十年的。"这句话他说过很多次。这一次,他是对着那张老照片说的。

优缪思 微信公众号二维码
微信扫码关注订阅号 · 优缪思,获取 PM / AI 精选内容