Appearance
Token、Prompt 与上下文
token、prompt 和 context window 是一条连续链:
- tokenizer 决定模型到底看到了什么
- prompt 决定这些 token 怎样组织
- context window 决定单次请求里能装下多少信息
相关页面
这三部分分别回答什么
1. Token 化与 DeepSeek 实例
看的是:
- 文本如何被 tokenizer 切开
- 中文、英文、代码、路径、标点的差异
- DeepSeek 开源 tokenizer 的真实切分例子
2. Prompt 写法
看的是:
- 为什么人类自然语言习惯不完全适合 LLM
- 口语 prompt、结构化 prompt、agent prompt 的差别
- 哪些写法看似自然,其实对模型不友好
3. 上下文窗口与 Agent 预算
看的是:
- prompt 为什么比你想象中更长
- 上下文窗口真正装了什么
- agentic engineering 里怎样给工作集留余量
- 为什么
75%更像经验上限,而不是死规则
推荐阅读顺序
text
Token 化
-> Prompt 写法
-> 上下文窗口与 Agent 预算结论
token、prompt、context window是一条连续链,而不是三个孤立概念- 如果你只想先读一页,推荐先看 Token 化与 DeepSeek 实例