Skip to content

AI 应用基础设施三层

如果把 GPU 集群、模型部署、RAG、MCP、Agent runtime、eval 和审批都统称为 AI Infra,读者很容易在第一步就把不同层级的问题混在一起。更稳妥的做法,是先把它们拆成三层,再按层理解。

这一页只做总览,不展开细节。三层的详细介绍分别放在后面的独立页面里。

相关页面

  1. AI 应用基础设施三层
  2. Model Infrastructure:算力、集群与模型服务
  3. LLMOps、Context Layer 与 Tooling Layer
  4. Agentic Infrastructure:上下文、工具、运行时与治理
  5. 成本总览

三层总览

层级推荐英文中文可译主要问题典型对象
第一层AI Compute Infrastructure / Model InfrastructureAI 算力基础设施 / 模型基础设施模型怎么训练、部署和推理GPU、TPU、网络、存储、训练集群、推理引擎、模型服务
第二层LLMOps + Context Layer + Tooling Layer大模型工程化 + 上下文层 + 工具层模型如何接入知识、数据和外部系统部署、微调、评测、RAG、知识库、记忆、MCP、连接器、浏览器、数据库
第三层Agentic Infrastructure / AI Application Infrastructure智能体基础设施 / AI 应用基础设施模型如何持续行动、协作、试错并被治理agent runtime、workflow、state、handoff、sandbox、observability、eval、governance

该怎么读这三层

第一层:Model Infrastructure

这一层最接近云基础设施和模型服务本身。它回答的是:

模型怎么被训练出来、部署起来,并稳定提供推理服务。

如果你在讨论显存、带宽、训练集群、推理引擎、服务吞吐和扩缩容,你大概率就在这一层。

详细介绍见:Model Infrastructure:算力、集群与模型服务

第二层:LLMOps、Context Layer 与 Tooling Layer

这一层开始进入应用工程。它回答的是:

模型如何接入企业知识、业务数据和外部系统。

如果你在讨论部署流程、评测、RAG、知识库、MCP、浏览器、数据库和 API 连接器,你大概率就在这一层。

详细介绍见:LLMOps、Context Layer 与 Tooling Layer

第三层:Agentic Infrastructure

这一层已经不只是“模型接入世界”,而是“模型如何持续工作”。它回答的是:

模型如何变成一个可执行长任务、可恢复、可治理、可观测的工作系统。

如果你在讨论 runtime、workflow、state、handoff、sandbox、eval、observability 和 governance,你大概率就在这一层。

详细介绍见:Agentic Infrastructure:上下文、工具、运行时与治理

为什么不要都叫 AI Infra

把三层拆开以后,很多讨论会立刻清楚:

  • 谈 GPU、推理引擎和模型服务时,用 AI Compute InfrastructureModel Infrastructure 更准确
  • 谈部署、评测、知识接入和工具连接时,用 LLMOpsContext LayerTooling Layer 更准确
  • 谈 agent 的运行时、观测、治理和长期任务时,用 Agentic Infrastructure 更准确

这样做的好处不是追求术语花样,而是避免把不同层级的问题混成一团。否则你会一边在说 GPU 集群,一边在说 MCP,一边又在说审批与 tracing,最后每个词都失去边界。

一条最实用的阅读顺序

如果你是第一次系统看这一组内容,比较顺的顺序通常是:

  1. 先看本页,建立三层边界
  2. 再看 Model Infrastructure:算力、集群与模型服务,理解模型为什么不是“起个 API”这么简单
  3. 然后看 LLMOps、Context Layer 与 Tooling Layer,理解应用为什么不只是换个模型
  4. 最后看 Agentic Infrastructure:上下文、工具、运行时与治理,理解为什么 agent 系统会把工程复杂度再往上推一层

结论

  • 狭义 AI Infrastructure 通常仍然指模型训练与推理的底层基础设施
  • 一旦讨论模型如何接入知识、数据和工具,通常已经进入 LLMOps、Context Layer 与 Tooling Layer
  • 当你真正讨论“给模型装上记忆、工具、工作流、观测和治理边界”的系统时,更准确的词是 Agentic Infrastructure

参考资料

价格、型号与硬件配置按 2026-04-28 的公开页面静态整理。