什么是Token
理解AI模型的基本处理单位Token,学会估算API成本
4分钟
2025-12-15
基础概念TokenAPI计费
什么是Token
简单理解
Token是大语言模型处理文本的基本单位。你可以把它理解为模型"阅读"和"生成"文本的最小片段。
Token不等于单词!一个单词可能被拆分成多个Token,一个Token也可能包含多个字符。
Token是怎么工作的?
英文示例
- "Hello" → 1 token
- "ChatGPT" → 2 tokens (Chat + GPT)
- "Anthropic" → 3 tokens
中文示例
- "你好" → 通常1-2个tokens
- "人工智能" → 通常2-4个tokens
- 中文平均每个字约1.5-2个tokens
为什么Token很重要?
1. API计费
大模型API按Token数量收费,分为:
- 输入Token:你发送给模型的内容
- 输出Token:模型生成的回答
2. 使用限制
- 上下文窗口以Token计算
- 模型输出长度也有Token限制
主流模型Token价格参考
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| GPT-5.2 | $15/1M tokens | $60/1M tokens |
| Claude Opus 4.5 | $15/1M tokens | $75/1M tokens |
| DeepSeek V3.2 | ¥1/1M tokens | ¥2/1M tokens |
| Kimi K2 | ¥4/1M tokens | ¥16/1M tokens |
如何估算Token数量?
经验法则
- 英文:1 token ≈ 4个字符 ≈ 0.75个单词
- 中文:1 token ≈ 1.5-2个汉字
实用工具
- OpenAI Tokenizer: https://platform.openai.com/tokenizer
- 各平台通常提供Token计数API
省钱小技巧
- 精简提示词:去除不必要的修饰语
- 限制输出长度:设置max_tokens参数
- 选择合适模型:简单任务用小模型
- 缓存常用回答:避免重复调用