Appearance
AI 全景图
这套笔记的内容,不是按产品类型分,也不是按“训练 / 推理 / 部署”这几个宽泛词硬切,而是按正文真正讨论的 5 组内容来排:
基础概念推理时算力账算力扩展AI 应用基础设施成本模型
先看这五组内容之间的关系
text
文本进入模型
-> Token 化、Prompt 写法、上下文窗口
-> 推理时每生成一点 token 要花多少钱
-> 模型能力怎样通过预训练、后训练、推理时扩展继续变强
-> 这些能力怎样通过基础设施变成真实系统
-> 最终怎样形成开发和运行阶段的成本这就是整套笔记的主线。
1. 基础概念
这一组主要看输入侧。 核心问题是:
- 文本怎样变成 token
- prompt 为什么和自然语言习惯不完全一样
- 为什么上下文窗口不是“越长越好”
2. 推理时算力账
这一组主要看推理阶段的成本账。 核心问题是:
- 自建推理到底是看购置价、吞吐、利用率还是元 / M
- frontier open-weight 模型和 hosted 模型各落在什么价格带
- 本地、自建集群和在线 API 的经济边界各在哪
3. 算力扩展
这一组主要看模型能力的形成过程。 核心问题是:
- 模型为什么还能继续扩
- 预训练怎样把钱分给参数、token 和数据质量
- 后训练怎样把底座模型整理成可交付产品
- 推理时扩展怎样在单次任务里继续加计算
4. AI 应用基础设施
- AI 应用基础设施三层
- Model Infrastructure:算力、集群与模型服务
- LLMOps、Context Layer 与 Tooling Layer
- Agentic Infrastructure:上下文、工具、运行时与治理
这一组主要看系统层。 核心问题是:
- 模型怎样被训练、部署和服务化
- 应用怎样接入知识、数据和外部工具
- agent 系统怎样运行、观测、评测和治理
5. 成本模型
这一组主要看项目账本。 核心问题是:
- 开发期不同项目大概会烧多少 token
- 评测、重试、工具调用怎样变成第二张账单
- 运行期 AI 搜索、客服、编程助手和平台型系统分别怎么花钱
怎么开始读
路线 1:先看输入怎样进入模型
路线 2:先看推理账
路线 3:先看模型能力怎样形成
路线 4:先看系统是怎样搭出来的
- AI 应用基础设施三层
- Model Infrastructure:算力、集群与模型服务
- LLMOps、Context Layer 与 Tooling Layer
- Agentic Infrastructure:上下文、工具、运行时与治理
结论
- 这套笔记真正串起来的是:
模型输入 -> 推理账 -> 能力形成 -> 系统落地 -> 项目成本 - 首页和目录只是入口,真正的边界还是要回到每页正文看
- 如果你能把这 5 组内容连起来,这套笔记就会从“概念集合”变成“工程地图”