开发成本

AI 项目的开发预算，最常见的错误是只看“模型单价”。

先建立一个“每 1M 总 token”成本感觉

假设一种常见流量结构：

80% input
20% output

按这个结构计算的粗略“综合单价”：

模型	粗略综合单价（每 1M 总 token）
Step-3.5 Flash	`$0.14`
Qwen3.6 Plus	`$0.65`
GPT-5.4 mini	`$1.50`
Claude Sonnet 4	`$5.40`

开发期：不同难度项目大概会烧多少 token

项目类型	典型开发期 token 量级	说明
脚本 / 小自动化	`0.5M - 5M`	单文件、少量调试、少量来回
单模块 / 小服务	`5M - 30M`	有接口设计、测试、重构和文档
毕设级项目	`20M - 100M`	多模块、多页面、反复调试，通常还会加 RAG 或 agent
工业级项目	`100M - 1B`	多角色协作、持续迭代、评测、回归、上线准备
平台级系统	`1B+`	多团队、多工作流、长期运行、运维与分析持续消耗

把这些 token 乘成钱，会是什么感觉

以开发期 30M token 为例

模型	粗略开发成本
Step-3.5 Flash	`$4.2`
Qwen3.6 Plus	`$19.5`
GPT-5.4 mini	`$45`
Claude Sonnet 4	`$162`

以开发期 300M token 为例

模型	粗略开发成本
Step-3.5 Flash	`$42`
Qwen3.6 Plus	`$195`
GPT-5.4 mini	`$450`
Claude Sonnet 4	`$1,620`

评测期经常是第二个隐藏账单

很多团队会低估：

prompt A/B
benchmark 重跑
regression 套件
多模型对照
red teaming

结论

开发期的真正放大器，不是“有没有用 AI”，而是用什么模型层级、做多少来回、跑多少回归
评测期和回归期通常是第二张账单