Appearance
LLMOps、Context Layer 与 Tooling Layer
只把模型部署起来,并不意味着它已经能在业务里工作。
模型虽然会回答,但它往往不知道你公司的内部知识,不知道当前环境发生了什么,也不知道怎样调用外部系统完成动作。所以在 Model Infrastructure 之上,AI 应用还需要第二层:
把模型接到知识、数据、流程和工具上的应用基础设施。
这一层通常可以拆成三部分:LLMOps、Context Layer 和 Tooling Layer。
这一层到底解决什么
它解决的不是 GPU 不够,也不是 agent 怎样长期运行,而是一个更贴近业务现场的问题:
如何把一个通用模型,接成一个理解业务语境、能访问外部信息、能调用外部系统的应用组件。
如果没有这一层,模型大概率会表现成下面这种状态:
- 回答听起来像懂,其实不掌握你的业务事实
- 一旦问题涉及私有资料,马上变得空泛
- 遇到需要查库、查日志、查网页的任务时无从下手
- 能描述步骤,但不能真正执行步骤
1. LLMOps:让模型应用可以被开发、部署和维护
LLMOps 可以理解成大模型应用的工程化与运维化。
它最关心的是:
- 模型版本怎么管理
- prompt 和 workflow 怎么迭代
- 微调与评测怎么接到发布流程
- 线上行为如何监控
- 回归问题如何发现和回滚
如果说 Model Infrastructure 让模型能跑,那么 LLMOps 让模型应用能被团队持续开发和维护。
它通常会涉及:
- 部署流程
- 版本管理
- 在线监控
- 评测集
- 自动回归检查
- 发布与回滚
- 权限和环境隔离
这里最容易误解的一点是:LLMOps 并不只是“运维”。它其实是在把大模型应用从实验状态,推进到可迭代、可发布、可维护的工程状态。
2. Context Layer:让模型不再只靠参数记忆回答
模型参数里包含的是训练时压缩进去的旧世界,它并不知道你企业的最新文档、项目状态、历史决策和业务规则。
所以第二部分是 Context Layer,也就是上下文层。
这一层的重点不是“多塞一点资料给模型”,而是:
把真正相关的业务语境,在合适的时刻、以合适的形式送进模型。
常见对象包括:
- RAG
- 知识库
- memory store
- semantic layer
- profile store
- 组织规范
- 项目约束
- 历史决策记录
这里为什么不能把它都叫 RAG?因为 RAG 只是其中一种做法,而上下文层真正要解决的是更大的问题:
- 什么信息值得给模型
- 什么信息必须先过滤权限
- 什么信息需要先结构化
- 什么信息应该被长期记住
- 什么信息只是这一次任务的临时工作记忆
也就是说,context layer 的核心不是“检索”,而是“让模型理解自己现在身处什么语境”。
3. Tooling Layer:让模型接上真实系统
就算模型已经拿到正确语境,它仍然可能只能“说得像会做”,却不能真的做。
这时就需要 Tooling Layer。
这一层要解决的是:
- 如何把数据库、文件系统、网页、浏览器、业务 API 暴露给模型
- 如何让模型用尽量稳定的接口调用这些能力
- 如何限制工具权限,避免误操作
常见对象包括:
- function calling
- MCP
- API connectors
- browser tools
- file tools
- database tools
- shell / code interpreter
对读者来说,最值得抓住的不是“协议名词”,而是一个很朴素的判断:
工具层存在的意义,是把模型从“回答器”接成“可行动的应用组件”。
其中 MCP 之所以重要,不是因为它时髦,而是因为它试图把工具和上下文接入标准化,减少每个系统都重新发明接口的成本。
4. 为什么第二层经常决定业务效果
很多团队会发现:同一个模型,在不同系统里表现差异非常大。
往往不是因为底座模型差别大到天上地下,而是因为第二层做得好不好:
- 是否把真正相关的知识给到了模型
- 是否给了模型高质量工具
- 是否把工具返回结果整理成模型看得懂的上下文
- 是否在发布流程里做了评测和回归
所以很多业务效果问题,表面上像“模型不够强”,本质上可能是:
- 上下文给错了
- 工具接口太差
- 权限过滤没做好
- prompt 与 workflow 没被工程化管理
这也是为什么第二层通常是应用团队最先能做出差异化的地方。
5. 为什么这一层还不等于 Agentic Infrastructure
读者很容易把“有工具、有知识库”直接理解成 agent system。实际上还差一整层。
第二层更像是在解决:
- 模型看到了什么
- 模型能调用什么
- 模型应用如何被工程化管理
而 Agentic Infrastructure 解决的是:
- 任务怎么拆成多步
- 中途失败怎么恢复
- 哪一步要人审批
- 多个 agent 如何交接
- 系统如何被观测和治理
所以第二层是 接入层,第三层才是 组织层。
6. 你应该怎样理解这一层
当一个讨论主要围绕下面这些问题时,你大概率就在谈第二层:
- 模型如何接企业知识
- RAG 应该怎么做权限过滤和引用回传
- prompt / workflow 如何版本化
- MCP 或 function calling 如何设计
- 工具接口如何让模型更稳定地使用
这时用 LLMOps、Context Layer、Tooling Layer 会比笼统说 AI Infra 更准确,也更方便和别人对齐边界。
结论
- LLMOps 负责把模型应用变成可开发、可发布、可维护的工程对象
- Context Layer 负责给模型补业务语境、记忆和证据
- Tooling Layer 负责把模型接到数据库、文件、浏览器和业务 API 上
- 这一层往往最直接决定模型在业务里的实际可用性,但它还不是完整的 agent system