模型与价格
51API 聚合了多个主流 AI 模型渠道,一个 API Key 可以统一调用不同厂商的模型。
价格更新时间
以下倍率更新于 2026-03-15。最终扣费以系统实际结算、控制台日志和上游实时计费为准。
计费说明
字段含义
ModelRatio:模型输入倍率CompletionRatio:模型输出倍率分组倍率:创建令牌时所选分组的倍率
计费公式
最终费用 = (输入Token + 输出Token × CompletionRatio) × ModelRatio × 分组倍率1
如果你只是想快速判断一个模型“实际贵不贵”,可以直接看下面两个综合系数:
综合输入倍率 = ModelRatio × 分组倍率
综合输出倍率 = ModelRatio × CompletionRatio × 分组倍率1
2
2
这两个综合倍率怎么用
- 综合输入倍率越低,输入越便宜
- 综合输出倍率越低,长回复越便宜
- 不要只看
CompletionRatio,还要一起看ModelRatio
分组倍率
| 分组 | 分组倍率 | 适用模型 |
|---|---|---|
gpt | 1x | OpenAI / ChatGPT / Codex |
claude | 1.2x | Claude |
gemini | 1.4x | Gemini |
grok | 1x | Grok |
说明
本文本次只同步已确认的 ModelRatio 和 CompletionRatio。如存在缓存命中、特殊活动价、VIP 分组等情况,仍以控制台实际日志为准。
OpenAI / ChatGPT
令牌分组:gpt
| 模型 | Model ID | ModelRatio | CompletionRatio | 分组倍率 | 综合输入倍率 | 综合输出倍率 |
|---|---|---|---|---|---|---|
| GPT-4o | gpt-4o | 1.25x | 4x | 1x | 1.25x | 5x |
| GPT-4.1 Mini | gpt-4-1-mini | 0.2x | 4x | 1x | 0.2x | 0.8x |
| GPT-5 | gpt-5 | 0.625x | 8x | 1x | 0.625x | 5x |
| GPT-5 Thinking | gpt-5-thinking | 0.625x | 8x | 1x | 0.625x | 5x |
| O3 Mini | o3-mini | 0.55x | 4x | 1x | 0.55x | 2.2x |
OpenAI / Codex
令牌分组:gpt
| 模型 | Model ID | ModelRatio | CompletionRatio | 分组倍率 | 综合输入倍率 | 综合输出倍率 |
|---|---|---|---|---|---|---|
| GPT-5.1 | gpt-5.1 | 0.625x | 8x | 1x | 0.625x | 5x |
| GPT-5.2 | gpt-5.2 | 0.875x | 8x | 1x | 0.875x | 7x |
| GPT-5.4 | gpt-5.4 | 1.25x | 6x | 1x | 1.25x | 7.5x |
| GPT-5 Codex | gpt-5-codex | 0.625x | 8x | 1x | 0.625x | 5x |
| GPT-5 Codex Mini | gpt-5-codex-mini | 0.125x | 8x | 1x | 0.125x | 1x |
| GPT-5.1 Codex | gpt-5.1-codex | 0.625x | 8x | 1x | 0.625x | 5x |
| GPT-5.1 Codex Max | gpt-5.1-codex-max | 0.625x | 8x | 1x | 0.625x | 5x |
| GPT-5.1 Codex Mini | gpt-5.1-codex-mini | 0.125x | 8x | 1x | 0.125x | 1x |
| GPT-5.2 Codex | gpt-5.2-codex | 0.875x | 8x | 1x | 0.875x | 7x |
| GPT-5.3 Codex | gpt-5.3-codex | 0.875x | 8x | 1x | 0.875x | 7x |
| GPT-5.3 Codex Spark | gpt-5.3-codex-spark | 0.875x | 8x | 1x | 0.875x | 7x |
Claude
令牌分组:claude
| 模型 | Model ID | ModelRatio | CompletionRatio | 分组倍率 | 综合输入倍率 | 综合输出倍率 |
|---|---|---|---|---|---|---|
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | 0.5x | 5x | 1.2x | 0.6x | 3x |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | 1.5x | 5x | 1.2x | 1.8x | 9x |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 1.5x | 5x | 1.2x | 1.8x | 9x |
Gemini
gemini_cli
令牌分组:gemini
| 模型 | Model ID | ModelRatio | CompletionRatio | 分组倍率 | 综合输入倍率 | 综合输出倍率 |
|---|---|---|---|---|---|---|
| Gemini 2.5 Flash | gemini-2.5-flash | 0.15x | 8.3333333333x | 1.4x | 0.21x | 1.75x |
| Gemini 2.5 Pro | gemini-2.5-pro | 0.625x | 8x | 1.4x | 0.875x | 7x |
gemini_official
令牌分组:gemini
| 模型 | Model ID | ModelRatio | CompletionRatio | 分组倍率 | 综合输入倍率 | 综合输出倍率 |
|---|---|---|---|---|---|---|
| Gemini 3.1 Fast | gemini-3.1-fast | 0.125x | 6x | 1.4x | 0.175x | 1.05x |
| Gemini 3.1 Thinking | gemini-3.1-thinking | 1x | 6x | 1.4x | 1.4x | 8.4x |
| Gemini 3.1 Pro | gemini-3.1-pro | 1x | 6x | 1.4x | 1.4x | 8.4x |
Grok
令牌分组:grok
| 模型 | Model ID | ModelRatio | CompletionRatio | 分组倍率 | 综合输入倍率 | 综合输出倍率 |
|---|---|---|---|---|---|---|
| Grok-3 | grok-3 | 1.5x | 5x | 1x | 1.5x | 7.5x |
| Grok-4 | grok-4 | 1.5x | 5x | 1x | 1.5x | 7.5x |
| Grok-420 Agents | grok-420-agents | 1.5x | 5x | 1x | 1.5x | 7.5x |
| Grok-420 Fast | grok-420-fast | 0.1x | 2.5x | 1x | 0.1x | 0.25x |
| Grok-420 Thinking | grok-420-thinking | 1.5x | 5x | 1x | 1.5x | 7.5x |
快速推荐
| 使用场景 | 推荐模型 | 原因 |
|---|---|---|
| 极低成本试跑 | grok-420-fast | 综合输入 0.1x,综合输出 0.25x,当前公开倍率最低 |
| 高频低成本 | gemini-3.1-fast | 综合输入 0.175x,综合输出 1.05x |
| 通用省钱 | gemini-2.5-flash | 综合输入 0.21x,综合输出 1.75x |
| OpenAI 主力 | gpt-5 | 综合输入 0.625x,综合输出 5x |
| 多模态兼容 | gpt-4o | 综合输出 5x,适合沿用现有 OpenAI 兼容代码 |
| 长文写作 | claude-sonnet-4-6 | 综合输出 9x,适合长文本和复杂输出 |
| 代码低成本 | gpt-5-codex-mini | 综合输入 0.125x,综合输出 1x |
费用计算示例
示例 1:普通对话
使用 gpt 分组(1x)调用 gpt-4o(ModelRatio = 1.25,CompletionRatio = 4):
- 输入:1000 tokens
- 输出:500 tokens
费用 = (1000 + 500 × 4) × 1.25 × 1
= 3000 × 1.25
= 3750 单位1
2
3
2
3
示例 2:推理模型
使用 gpt 分组(1x)调用 gpt-5-thinking(ModelRatio = 0.625,CompletionRatio = 8):
- 输入:1000 tokens
- 输出:500 tokens
费用 = (1000 + 500 × 8) × 0.625 × 1
= 5000 × 0.625
= 3125 单位1
2
3
2
3
观察点
虽然 gpt-5-thinking 的 CompletionRatio 更高,但因为 ModelRatio 更低,所以这组示例下总费用反而低于 gpt-4o。
示例 3:Gemini 低成本方案
使用 gemini 分组(1.4x)调用 gemini-2.5-flash(ModelRatio = 0.15,CompletionRatio = 8.3333333333):
- 输入:1000 tokens
- 输出:500 tokens
费用 = (1000 + 500 × 8.3333333333) × 0.15 × 1.4
≈ 5166.67 × 0.21
≈ 1085 单位1
2
3
2
3
示例 4:极低倍率方案
使用 grok 分组(1x)调用 grok-420-fast(ModelRatio = 0.1,CompletionRatio = 2.5):
- 输入:1000 tokens
- 输出:500 tokens
费用 = (1000 + 500 × 2.5) × 0.1 × 1
= 2250 × 0.1
= 225 单位1
2
3
2
3
查看实时消耗
登录控制台,在「日志」页面可查看每笔请求的实际 ModelRatio、CompletionRatio、分组倍率和最终扣费。