Skip to content

AI 笔记从 token 到 AI 系统

围绕基础概念、推理时算力账、算力扩展、AI 应用基础设施与成本模型五组内容,理解模型、系统与成本之间的关系。

站点口径

价格、型号与硬件配置按 2026-04-28 的公开网页做静态快照。文中人民币换算统一按 1 USD ≈ 7.25 CNY 估算,只用于帮助形成量级感。

这套笔记在写什么

  1. 基础概念 文本怎样变成 token,prompt 怎样组织,上下文窗口怎样影响效果、延迟和成本。

  2. 推理时算力账 同样是生成 token,本地、自建集群和在线 API 的账为什么会差这么多。

  3. 算力扩展 模型能力怎样沿着规模扩展、预训练、后训练和推理时扩展这几段继续往上走。

  4. AI 应用基础设施 为什么一个 AI 系统除了模型,还要单独看模型服务、上下文层、工具层、运行时和治理。

  5. 成本模型 开发期、评测期和运行期的 token、工具、人工和运维成本应该怎样一起算。

三条阅读路径

1. 先补概念

AI 全景图 -> Token 化与 DeepSeek 实例 -> Prompt 写法 -> 上下文窗口与 Agent 预算

适合已经在用 AI,但经常把 token、prompt 和上下文预算混在一起的人。

2. 先看推理时算力账

推理时算力账总览 -> 自建推理算力账 -> 性能与价格全景表

适合需要先建立本地部署、API 价格和模型能力量级感的人。

3. 先看 AI 工程全栈

模型规模里程碑与规模扩展 -> 预训练:数据与训练 -> 后训练 -> 推理时扩展、Harness 与 Agent -> 扩展成本量化分析 -> AI 应用基础设施三层

适合希望把“模型为什么有效”和“系统为什么这样搭”连起来理解的人。

价格、型号与硬件配置按 2026-04-28 的公开页面静态整理。