郑总和一本还没写完的账

郑建华的办公桌是一张老式的实木写字台，1994 年厂里第一批统一采购的办公家具。

三十年了，桌面被磨出了一层暗色的包浆。左上角压着一张照片——黑白的，有些泛黄。照片里十来个人站在一台大型设备前，胸口别着红花，最左边那个年轻的就是郑建华，24 岁，刚进厂两年。1994 年，华岳精密第一条引进产线投产时的合影。

照片右边多了两张便签。一张是上周的 Agent 运营周报——本月份 token 消耗 12.7 万元，V-2 订单处理 Agent 的 ROI 为正（节省人工成本 18.3 万），T-1 文档处理系统的 ROI 为负（投入 6.2 万，节省 2.1 万），V-1 视觉质检 Agent 处于盈亏平衡线。便签下方还有一行小字备注："V-2 凌晨 3 点延迟问题已定位（模型热更新窗口），正在评估优化方案。"另一张便签是他手写的备注："T-1 需重新评估范围和成本结构。"

两张便签贴在那张 1994 年的老照片旁边，像两个时空叠在一起。

郑建华的履历表是一条完整的上升线：1992 年进厂当技术员，1998 年当设备工程师，2004 年当产线主管，2009 年当车间主任，2016 年升副总经理，分管生产和数字化转型。

这条线的意思是他干过厂里几乎每一个岗位——设备调试他干过，产线管理他干过，车间调度他管过，安全评审他参与过，质量事故他处理过，老师傅的退休和年轻人的培训他安排过。

他不写代码。他上一次碰编程语言是 1998 年用 PLC 梯形图调一台加工中心。但他知道一件事——建一座工厂需要什么。

需要设备工程师、产线主管、维护班组长、质量管理员、安全工程师、中控调度员、关键工位老师傅，还有盯着总账的人。缺了任何一个，这座厂都开不起来——不是因为别的岗位不重要，是因为每个岗位管的是"工厂"这个系统的不同切面，这些切面合在一起才是一个完整的工厂。

去年夏天，他在季度会上宣布了一件事：华岳精密要在三年内，改造成一家 AI 辅助运营的工厂。

消息公布的时候，会场没什么反应。大家听过太多类似的话。但这一次不一样。半年过去，厂里开始出现一些以前没见过的东西。

八个工位

郑建华不是那种"拍脑袋"的领导。他的做法是——先看清楚自己在建什么，再决定怎么建。

他花了半年时间，看清楚了八件事。每件事对应一个工位、一个人。

第一件：Agent 是设备，不是软件。 老周教会他的。老周用调设备的那套方法调 Agent，比 IT 部的工程师还系统——抄参数、跑基线、建故障模式库、分级授权。郑建华看到老周那本泛黄的病历本时，意识到一件事：厂里需要的不是"AI 工程师"，是需要有人把 Agent 当设备来管。老周就是这个人。

第二件：多 Agent 协作的关键是衔接，不是单体。 李雯教会他的。李雯把五个 Agent 串成一条产线，第一天就卡在衔接处。她用排产线的办法解决了——缓冲区、异常路由、节拍匹配。郑建华看到李雯墙上那张节拍图时，想的是：如果每个 Agent 是一台设备，那多 Agent 协作就是一条产线。管产线的手艺，AI 项目里一样用得上。

第三件：真正决定系统稳定性的是那些没人看见的支撑 Agent。 张师傅教会他的。主 Agent 上新闻，十三个 support agents 每天在出故障——张师傅用管设备的办法给它们建台账、定巡检周期、建依赖关系图。郑建华让 IT 部给张师傅开了独立监控权限之后，心里记了一笔：一座工厂的稳定性，从来不是由主产线决定的，是由那些不起眼的辅助系统决定的。

第四件：没有 QA 的系统，本质上是运气管理。 陈姐教会他的。陈姐那本活页夹——《Agent 质量评估手册 v0.1》——让郑建华意识到，厂里之前对 Agent 质量的管理全靠个人自觉。老周自觉建了基线，张师傅自觉建了台账。如果他们不做，没有人会做。这不是体系，是运气。陈姐把"运气管理"变成了"质量管理"，用的是工厂里用了一百年的那套 QA 逻辑。

第五件：安全不是出了事再补，是动工之前就定好红线。 王工教会他的。王工拔掉测试环境网线的那天，郑建华没有批评他——他心里清楚，王工做对了。一个能在测试环境访问财务数据的 Agent，如果带着同样的权限上了生产环境，后果不堪设想。王工的"AI 版 HAZOP"让郑建华确认了一件事：AI 安全不是补丁，是准入门槛。

第六件：没有可观测性的 Agent 系统，本质上是开盲盒。 小刘教会他的。小刘自己拼出来的那块仪表盘，在上线第一天就发现了 V-2 凌晨 3 点的延迟尖峰。如果那块屏不存在，这个问题可能要等到某天凌晨突发故障才会被发现。郑建华看到小刘桌上那五杯咖啡时，想的是：工厂里没人会问"要不要上 MES"，但 Agent 项目里 observability 常被当作 nice-to-have。这是认知差距，不是技术差距。

第七件：人不是系统的 fallback，是系统的一部分。 吴师傅教会他的。吴师傅那个"看三年，动手三年，独立三年"的带徒弟方式，被他用在了 Human in the Loop 的设计上——不是简单地加"确认按钮"，是从"出错了谁负责、谁能兜住"的角度决定哪些节点必须留人。郑建华派方远去跟吴师傅学这件事，不是因为方远不懂技术，是因为他太懂技术了——越懂技术的人，越容易觉得所有事都能自动化。需要有人提醒他，有些事不该。

一本账

八件事看清楚之后，郑建华知道自己面对的不是七个技术问题，是一个管理问题：怎么把七个工位的人和能力，组装成一座能运行的工厂。

他做的第一件事是——算账。

不是什么战略层面的"数字化转型 ROI"——那种东西都是 PPT 上的数字。他要算的是每一笔具体的钱。

他让小刘在仪表盘的 Cost 区加了一项新内容：每个 Agent 的月度运营成本和对应的人工成本节省。不是估算，是实算——token 消耗按实际账单，人工节省按被替代的工时和对应的工资。

第一个月的数字出来：

V-1 视觉质检：运营成本 1.2 万/月，人工节省 2.8 万/月。ROI 为正。但前提是——老周那套基线测试和分级授权持续运行，不然一次质量事故的赔偿可能把半年的节省全吞掉。
V-2 订单处理：运营成本 3.4 万/月，人工节省 5.1 万/月。ROI 为正。但李雯的产线节拍还在调优，异常路由比例偏高——每笔走人工的订单增加 8 分钟处理时间。
T-1 文档处理（含 S-1 到 S-13）：运营成本 6.2 万/月，人工节省 2.1 万/月。ROI 为负。张师傅的十三个 support agents 每天在出故障，维护成本被严重低估。
其他 Agent（V-3、T-2 等）：还在测试阶段，暂不计入。

郑建华看着这些数字，在便签上写了四个字："能算清账。"

这是他最在意的事——不是每个 Agent 都必须盈利，但每个 Agent 的成本和收益必须看得见。看不见的东西管不了——这是小刘说的。郑建华把这句话扩大了一圈：看不见的东西管不了，算不清的账做不了决策。

三个关卡

算清了账之后，郑建华做了第二件事——设关卡。

他给厂里所有 Agent 项目定了三个关卡：

第一关：PoC（概念验证）→ 试运行。 条件是——完成老周那套基线测试和故障模式库，通过陈姐的质量评审，通过王工的安全评审。三个评审缺一不可。过不了关的，停掉或者重做。

第二关：试运行 → 正式运营。 条件是——连续运行 90 天无重大故障、ROI 为正或战略性亏损有明确理由、李雯的产线节拍调优完成、张师傅的维护台账建好。任何一个条件不满足，继续试运行。

第三关：正式运营 → 稳态运营。 条件是——小刘的仪表盘覆盖全部运行指标、陈姐的质量监控从"抽样"升级到"持续"、王工的安全评审从"准入"升级到"周期复评"、吴师傅的 Human in the Loop 节点评估完成首次复评。

三道关卡，每道都对应一个工位的能力。不是郑建华发明出来的——工厂里新设备从进厂到正式投产，走的也是类似的流程。他只是把这套流程翻译了一下。

一座工厂

有天晚上，郑建华一个人留在办公室。桌上那张 1994 年的老照片在台灯下泛着暖光。照片里的那台引进产线，后来被更新了两次。照片里站在最右边的那位老师傅，已经退休十五年了。照片里的郑建华 24 岁，刚学会什么叫"生产"。

他翻开了桌上的一份文件——他自己写的，标题是《华岳精密 AI 辅助运营三年规划（2025-2028）》。第一页写着他去年夏天在季度会上说的那句话："三年内，把华岳精密改造成一家 AI 辅助运营的工厂。"

现在一年过去了。工厂里多了八个人在做八件以前不存在的事。老周在造设备、李雯在排产线、张师傅在做维护、陈姐在管质量、王工在守安全、小刘在看仪表盘、吴师傅在决定哪些活儿得留给人。

他们加在一起，才是一座完整的"Agent 工厂"。

郑建华在三年规划的空白处写了一行字：

一座工厂需要的不是最先进的设备，是每个工位上都有对的人在对的岗位上做对的事。

这座工厂也一样。

他看了看桌上那张老照片，又看了看旁边那两张便签——一张是 Agent 运营周报，一张是他对 T-1 的重新评估备注。1994 年，他用三年学会了什么叫生产。2026 年，他在用三年学会什么叫 AI 运营。"我不需要最先进的，我需要能跑十年的。"这句话他说过很多次。这一次，他是对着那张老照片说的。

八个工位

一本账

三个关卡

一座工厂

相关手记