Skip to content

AI 全景图

这套笔记的内容,不是按产品类型分,也不是按“训练 / 推理 / 部署”这几个宽泛词硬切,而是按正文真正讨论的 5 组内容来排:

  1. 基础概念
  2. 推理时算力账
  3. 算力扩展
  4. AI 应用基础设施
  5. 成本模型

先看这五组内容之间的关系

text
文本进入模型
  -> Token 化、Prompt 写法、上下文窗口
    -> 推理时每生成一点 token 要花多少钱
      -> 模型能力怎样通过预训练、后训练、推理时扩展继续变强
        -> 这些能力怎样通过基础设施变成真实系统
          -> 最终怎样形成开发和运行阶段的成本

这就是整套笔记的主线。

1. 基础概念

这一组主要看输入侧。 核心问题是:

  • 文本怎样变成 token
  • prompt 为什么和自然语言习惯不完全一样
  • 为什么上下文窗口不是“越长越好”

2. 推理时算力账

这一组主要看推理阶段的成本账。 核心问题是:

  • 自建推理到底是看购置价、吞吐、利用率还是元 / M
  • frontier open-weight 模型和 hosted 模型各落在什么价格带
  • 本地、自建集群和在线 API 的经济边界各在哪

3. 算力扩展

这一组主要看模型能力的形成过程。 核心问题是:

  • 模型为什么还能继续扩
  • 预训练怎样把钱分给参数、token 和数据质量
  • 后训练怎样把底座模型整理成可交付产品
  • 推理时扩展怎样在单次任务里继续加计算

4. AI 应用基础设施

这一组主要看系统层。 核心问题是:

  • 模型怎样被训练、部署和服务化
  • 应用怎样接入知识、数据和外部工具
  • agent 系统怎样运行、观测、评测和治理

5. 成本模型

这一组主要看项目账本。 核心问题是:

  • 开发期不同项目大概会烧多少 token
  • 评测、重试、工具调用怎样变成第二张账单
  • 运行期 AI 搜索、客服、编程助手和平台型系统分别怎么花钱

怎么开始读

路线 1:先看输入怎样进入模型

路线 2:先看推理账

路线 3:先看模型能力怎样形成

路线 4:先看系统是怎样搭出来的

结论

  • 这套笔记真正串起来的是:模型输入 -> 推理账 -> 能力形成 -> 系统落地 -> 项目成本
  • 首页和目录只是入口,真正的边界还是要回到每页正文看
  • 如果你能把这 5 组内容连起来,这套笔记就会从“概念集合”变成“工程地图”

价格、型号与硬件配置按 2026-04-28 的公开页面静态整理。