企业 AI / Agent 应用的技术分类框架

企业在拥抱 AI 的过程中，最常见的困惑不是"要不要用"，而是"从哪里开始、用什么方式"。面对 LLM、RAG、Agent 等眼花缭乱的概念，缺乏一个清晰的分类框架，决策就容易陷入选型焦虑。

本文按照一套能力原子 → 应用分类 → 落地路径的三层框架，帮助企业从技术本质出发，理解各类 AI 应用的核心差异，做出务实的优先级判断。

一、AI 应用的五种基础能力

所有企业 AI 应用，本质上都是以下五种原子能力的不同组合：

生成（Generation）：内容创作与输出
检索（Retrieval）：信息定位与召回
提取（Extraction）：结构化信息识别
总结（Summarization）：信息压缩与摘要
执行（Action）：工具调用与任务操作

不同的组合方式，对应不同的应用场景。例如智能客服是"检索 + 生成"的结合，合同分析是"提取 + 总结"，AI 编程助手则需要"检索 + 生成 + 执行"三者协同。

二、六类主流 AI 应用解析

内容生成

成熟度：高

典型场景包括市场文案、产品需求文档、代码生成、销售邮件。

技术架构相对简单：输入 → 提示词模板 → 大模型 → 输出。挑战在于质量和风格的稳定性，以及如何适配行业语言。

应对方法：使用标准化的提示词模板（角色 / 背景 / 任务三段式），用结构化输出控制格式，用 Few-shot 示例引导风格。

选型原则：内容生成场景，应始终选用能力范围内最好的模型。 省下来的不是模型调用费，而是人工二次优化的时间。

检索问答（RAG）

成熟度：中

典型场景：企业内部知识库、智能客服、法务查询。

架构流程是：文档 → 向量化 → 向量数据库 → 检索 → 大模型回答。常见问题包括检索不准、文档版本冲突、模型幻觉。

有效的应对策略：使用混合搜索（向量 + 关键词结合）、为文档添加元数据标签、引入重排机制并强制模型标注引用来源。

核心洞察：做 RAG 之前，先清理存量文档。高质量的 Markdown 分块，效果远好于对 PDF 的直接检索。数据质量决定了系统的天花板。

信息提取与结构化

成熟度：中

将非结构化数据（PDF、邮件、图片）转换为结构化输出（JSON、数据库字段）。

典型场景：发票识别、CRM 自动填充、舆情标签打标、合同关键条款解析。

主要挑战是文档布局复杂、字段缺失或识别异常，以及大量边缘情况。建议引入 Document AI 处理布局复杂文档，同时设置校验层和人工复核队列兜底。

数据总结与分析

成熟度：高

将大段文本压缩为关键洞察，输出结构化摘要。

典型场景：会议纪要生成、用户反馈汇总、月度报告整合。

长文本溢出上下文窗口是最常见的问题，Map-Reduce 策略（分块总结后再汇总）是主流解法。另外，层级化总结和结构化输出模板能有效防止信息丢失和输出不可控。

任务自动化 Agent

成熟度：低

Agent 的核心组件是：大模型 + 规划器 + 记忆 + 工具调用。

典型场景：自动化运营、深度调研（Deep Research）、工单自动处理。

这是六类应用中技术风险最高的一类。常见问题包括逻辑死循环、多次 LLM 调用带来的高成本，以及行为难以预测。

核心建议：不要一开始就追求全自主 Agent。先用 LangGraph 等工具构建"确定性路径"的工作流，在关键节点引入 LLM 判断，并加入人工确认环节。 逐步放开自主权，比一开始就全面开放风险小得多。

决策辅助

成熟度：低

将数据分析与大模型推理结合，输出建议而非直接执行。

典型场景：供应链决策支持、投资风险分析。

最大的挑战是数据孤岛、可解释性不足，以及责任归属模糊。需要建立统一数据中台，引入推理链追踪机制，并通过审计日志确保每个决策都有据可查、有人负责。

三、企业落地的四个阶段

AI 落地不应"一步到位"，而应沿着清晰的价值阶梯逐步推进。

第一阶段：提效，对应内容生成场景，用 AI 加速现有工作。技术路径最成熟，是最容易产生即时回报的切入点。

第二阶段：知识化，对应 RAG 问答，让组织的存量知识可被检索和利用。ROI 显著，且能解决企业长期面临的"知识孤岛"问题。

第三阶段：数据化，对应信息提取与数据总结，实现数据录入和分析的自动化，释放大量人工重复劳动。

第四阶段：智能化，对应 AI Agent 和决策辅助，构建自主工作流与辅助决策能力。潜在价值最大，但技术难度最高，建议在前三阶段积累充分后再推进。

结论：优先从 RAG 和信息提取入手，这两个场景 ROI 最高、技术路径最清晰。谨慎探索 Agent 和决策辅助，它们难度最高，但长期价值也最大。

四、技术选型与落地策略

模型选型原则

选型时，建议根据业务对响应速度、隐私安全、逻辑复杂度的要求分层决策。

内容生成场景，应选取当前最优质的模型，优先保证输出质量，不要在这里省钱。信息提取与自动化场景，使用够用的模型控制成本即可。无论哪种场景，符合当地法律法规是一切选型的大前提。

主流工具参考

大语言模型方面，国际主流有 GPT、Claude、Gemini、Grok，国内主流有通义千问、豆包、文心、智谱 GLM、MiniMax、Deepseek、Kimi 等。

工作流编排推荐 n8n 和 Dify，两者都有较低的上手门槛且支持私有化部署。

AI 编程方面，Claude Code 和 Open Code 配合各模型厂商的 Coding 套餐是当前主流选择。

四个核心落地策略

策略一：模型路由。 简单任务（总结、翻译、初级提取）使用轻量、低成本模型；复杂任务（Agent 规划、多文档推理）必须使用旗舰模型。不要用同一个模型处理所有任务。

策略二：数据基建优先。 上 RAG 之前先清理存量文档，统一格式为高质量 Markdown。涉及敏感数据的场景，考虑私有化部署（Embedding 可用 BGE 系列，大模型可用 Qwen 开源版）。

策略三：从工作流到 Agent 渐进演化。 先用 LangGraph 构建确定性路径的流程，在关键节点引入 LLM 判断，并始终保留人工确认环节，而非一开始就追求全自主。

策略四：建立评估体系。 构建企业内部测试集（Gold Dataset），使用 RAGAS 或 TruLens 对 RAG 系统进行忠实度、相关性、合规性的量化监控。没有评估体系，优化就是盲目的。

总结

对于处于初期探索阶段的企业，从 RAG + 信息提取入手是最务实的路径——这两个场景 ROI 显著，技术路径清晰，失败风险可控。

在此基础上，逐步积累数据资产、建立评估机制，再向 Agent 和决策辅助演进。

AI 落地的本质，是找到业务场景与技术能力之间最短的连接路径。