Appearance
开发成本
AI 项目的开发预算,最常见的错误是只看“模型单价”。
先建立一个“每 1M 总 token”成本感觉
假设一种常见流量结构:
80% input20% output
按这个结构计算的粗略“综合单价”:
| 模型 | 粗略综合单价(每 1M 总 token) |
|---|---|
| Step-3.5 Flash | $0.14 |
| Qwen3.6 Plus | $0.65 |
| GPT-5.4 mini | $1.50 |
| Claude Sonnet 4 | $5.40 |
开发期:不同难度项目大概会烧多少 token
| 项目类型 | 典型开发期 token 量级 | 说明 |
|---|---|---|
| 脚本 / 小自动化 | 0.5M - 5M | 单文件、少量调试、少量来回 |
| 单模块 / 小服务 | 5M - 30M | 有接口设计、测试、重构和文档 |
| 毕设级项目 | 20M - 100M | 多模块、多页面、反复调试,通常还会加 RAG 或 agent |
| 工业级项目 | 100M - 1B | 多角色协作、持续迭代、评测、回归、上线准备 |
| 平台级系统 | 1B+ | 多团队、多工作流、长期运行、运维与分析持续消耗 |
把这些 token 乘成钱,会是什么感觉
以开发期 30M token 为例
| 模型 | 粗略开发成本 |
|---|---|
| Step-3.5 Flash | $4.2 |
| Qwen3.6 Plus | $19.5 |
| GPT-5.4 mini | $45 |
| Claude Sonnet 4 | $162 |
以开发期 300M token 为例
| 模型 | 粗略开发成本 |
|---|---|
| Step-3.5 Flash | $42 |
| Qwen3.6 Plus | $195 |
| GPT-5.4 mini | $450 |
| Claude Sonnet 4 | $1,620 |
评测期经常是第二个隐藏账单
很多团队会低估:
- prompt A/B
- benchmark 重跑
- regression 套件
- 多模型对照
- red teaming
结论
- 开发期的真正放大器,不是“有没有用 AI”,而是用什么模型层级、做多少来回、跑多少回归
- 评测期和回归期通常是第二张账单