基础概念
从 Token 化、Prompt 写法和上下文窗口入手,先把模型输入这一层看清楚。
站点口径
价格、型号与硬件配置按 2026-04-28 的公开网页做静态快照。文中人民币换算统一按 1 USD ≈ 7.25 CNY 估算,只用于帮助形成量级感。
基础概念 文本怎样变成 token,prompt 怎样组织,上下文窗口怎样影响效果、延迟和成本。
推理时算力账 同样是生成 token,本地、自建集群和在线 API 的账为什么会差这么多。
算力扩展 模型能力怎样沿着规模扩展、预训练、后训练和推理时扩展这几段继续往上走。
AI 应用基础设施 为什么一个 AI 系统除了模型,还要单独看模型服务、上下文层、工具层、运行时和治理。
成本模型 开发期、评测期和运行期的 token、工具、人工和运维成本应该怎样一起算。
AI 全景图 -> Token 化与 DeepSeek 实例 -> Prompt 写法 -> 上下文窗口与 Agent 预算
适合已经在用 AI,但经常把 token、prompt 和上下文预算混在一起的人。
推理时算力账总览 -> 自建推理算力账 -> 性能与价格全景表
适合需要先建立本地部署、API 价格和模型能力量级感的人。
模型规模里程碑与规模扩展 -> 预训练:数据与训练 -> 后训练 -> 推理时扩展、Harness 与 Agent -> 扩展成本量化分析 -> AI 应用基础设施三层
适合希望把“模型为什么有效”和“系统为什么这样搭”连起来理解的人。