2026年国内外 AI 大模型 Token 定价 方案对比报告

覆盖全球 15+ 主流平台 · 基于 2026年5月最新公开数据

📅 报告日期:2026-05-08

📊 核心数据速览

$0.028
输入价格最低(DeepSeek V4 Flash 缓存命中/百万Token)
¥0.2
国内入门级最低(DeepSeek V3 输入/百万Token)
$150
输出价格最高(Claude Opus 4.6 Fast / 百万Token)
$0.10
全球最便宜入门(Gemini 2.5 Flash-Lite / 百万Token)

🌍 一、国外平台定价方案

1.1 OpenAI

模型输入 (每百万Token)输出 (每百万Token)上下文备注
GPT-4.1$5.00$15.001M最新推荐生产模型
GPT-4.1 Mini$0.40$1.601M高性价比
GPT-4o (遗留)$2.50 $10.00128K老用户可继续使用
GPT-4o Mini$0.15$0.60128K成本优化选择
GPT-5$1.25$10.00-最新旗舰
GPT-5 Mini$0.25$2.00-轻量级
✅ Batch API 5折 · Prompt Caching 最高减 90% · o3 推理模型 $10/$40

1.2 Anthropic (Claude)

模型输入 (每百万Token)输出 (每百万Token)上下文备注
Claude Opus 4.6$5.00$25.00200K最强推理
Claude Opus 4.6 (Fast)$30.00$150.00200K🔥 全表最高价
Claude Sonnet 4.6$3.00$15.00200K主力模型
Claude Haiku 4.5$0.80$4.00200K轻量模型
✅ Batch API 5折 · Prompt Caching · 工具调用/代码执行额外计费 · 超 200K 输入加价

📌 Claude 订阅计划

Pro $20/月 · Max $100-200/月 · Team Standard $25/座/月 · Team Premium $125/座/月 · Enterprise 定制(约 $50,000/年起)

1.3 Google Gemini

模型输入 (每百万Token)输出 (每百万Token)上下文备注
Gemini 3.1 Pro$2.00 - $4.00$12.00 - $18.002M旗舰推理
Gemini 3.1 Flash-Lite$0.25$1.501M新款性价比之选
Gemini 3 Flash$0.50$2.001M速度均衡
Gemini 2.5 Flash$0.15$0.601M高性价比
Gemini 2.5 Flash-Lite$0.10$0.401M🥇 全球最低价
Gemini 2.5 Pro$1.25 - $2.50$5.00 - $10.002M上代旗舰
✅ 免费层:2.5 Pro 每日 1500 次接地请求 · 上下文高达 2M Token · 原生多模态

1.4 其他国外重要平台

🤖 Mistral AI

Mistral Large 2$4.00 / $12.00
Mistral Small$0.50 / $1.50
Codestral$4.00 / $12.00
Apache 2.0 · 开源可自部署

🦙 Meta Llama

Llama 4 Scout开源免费
Llama 4 Maverick开源免费
Together/Groq 等平台托管

⚡ Grok (xAI)

Grok-3xAI API 按需
X Premium+ 含 Grok

🧠 Amazon Bedrock

Nova Pro$0.80 / $3.20
Nova Lite$0.06 / $0.24
AWS 整合 · 企业级安全

1.5 国外平台价格总览(每百万 Token,美元)

排名平台性价比款输入输出评价
🥇GoogleGemini 2.5 Flash-Lite$0.10$0.40全球最低
🥈OpenAIGPT-4o Mini$0.15$0.60极高性价比
🥉GoogleGemini 2.5 Flash$0.15$0.60与GPT-4o Mini持平
4OpenAIGPT-4.1 Mini$0.40$1.60新一代性价比
5AnthropicHaiku 4.5$0.80$4.00轻量快速
6GoogleGemini 3 Flash$0.50$2.00速度均衡
7AmazonNova Pro$0.80$3.20AWS原生
8OpenAIGPT-4o$2.50$10.00遗留但依然强
9AnthropicSonnet 4.6$3.00$15.00主力模型
10MistralLarge 2$4.00$12.00欧洲最佳
11OpenAIGPT-4.1$5.00$15.00最新旗舰
12AnthropicOpus 4.6$5.00$25.00最强推理

💡 国外平台关键洞察

价格战白热化: Google Gemini 2.5 Flash-Lite 以 $0.10/$0.40 创全球全类型模型最低价。

性价比断层: 入门模型 ($0.10-0.80) 与旗舰模型 ($3-25) 之间 10~50 倍差距。

Anthropic 最贵但最稳: Opus 系列在复杂推理、编程方面仍是标杆。

Hidden Cost: 工具调用、代码执行、超长上下文额外加价,实际账单可能高 30-50%。

🇨🇳 二、国内平台定价方案

2.1 DeepSeek(深度求索)

模型输入-缓存未命中输入-缓存命中输出上下文备注
DeepSeek V4 Pro (常规)$1.74$0.0145$3.481M旗舰推理
DeepSeek V4 Pro (促销)$0.435$0.0036$0.871M75% 折扣
DeepSeek V4 Flash$0.14$0.0028$0.281M🥇 全球输入最低
DeepSeek V3 (Chat/Reasoner)¥0.2 / $0.28¥0.02 / $0.028¥0.8 / $0.42128K国内市场经典
✅ 上下文缓存默认开启(缓存命中 90% 折扣)· MoE 架构 · OpenAI 兼容接口

2.2 国内平台 Token 价格横向对比(入门级,人民币/百万Token)

排名平台入门模型输入输出100元可得Token免费额度
🥇字节豆包豆包-Lite¥0.30¥0.60~2.2亿100万/月
🥇DeepSeekDeepSeek-V3¥0.20¥0.80~2亿
🥉通义千问Qwen-Turbo¥0.50¥1.00~1.33亿7000万(一次性)
🥉智谱GLMGLM-Edge¥0.50¥1.00~1.33亿100万(一次性)
5腾讯混元混元-Lite¥0.60¥1.20~1.11亿
5讯飞星火星火-Lite¥0.60¥1.20~1.11亿5万/月
7华为盘古盘古-Lite¥0.80¥1.50~0.87亿
7MiniMaxMiniMax-Lite¥0.80¥1.50~0.87亿5万/月
9文心一言文心-Speed¥0.80¥1.60~0.83亿5万/月
10Kimi (月之暗面)Kimi-Small¥1.00¥2.00~0.67亿10万/月

2.3 国内平台旗舰级价格对比(换算为美元/百万Token,1 USD ≈ 7.25 CNY)

平台旗舰模型输入输出质量评价
DeepSeekV4 Pro$1.74$3.48⭐⭐⭐⭐⭐ 编程首选
字节豆包豆包-Pro~$0.55~$1.65⭐⭐⭐⭐ 多模态强
通义千问Qwen-Max~$0.55~$1.65⭐⭐⭐⭐⭐ 中文最佳
智谱GLMGLM-4-Plus~$0.69~$2.07⭐⭐⭐⭐ 推理强
文心一言ERNIE-4.5~$0.83~$2.76⭐⭐⭐⭐ 知识丰富
腾讯混元混元-Pro~$0.69~$2.07⭐⭐⭐⭐ 生态好
KimiKimi-K2~$1.10~$3.31⭐⭐⭐⭐ 长上下文强
华为盘古盘古-Pro~$0.83~$2.76⭐⭐⭐ 企业级

2.4 国内 Coding Plan 订阅套餐对比

平台入门月价计费单位核心额度支持模型
阿里云百炼¥49/首月API请求次数1万次/月Qwen-Max, Qwen-Coder
火山方舟(字节)¥49/首月API请求次数1万次/月豆包-Pro, DeepSeek-V3
智谱GLM¥50/月Prompt次数500次PromptGLM-4-Plus, CodeGeeX
Kimi (月之暗面)¥50/月Token限时3倍额度Kimi-K2
MiniMax¥69/月Prompt次数标准额度MiniMax-Text
无问芯穹¥199/起API请求次数专业级多模型网关

💡 国内平台关键洞察

DeepSeek 断层式领先: 入门级 ¥0.2/百万Token,旗舰级也仅 $1.74/$3.48。

字节豆包最慷慨: 综合单价最低(¥0.45/百万Token),100元可得 2.2亿 Token。

通义千问综合实力强: 旗舰 Qwen-Max 中文理解能力国内顶尖,价格适中。

Kimi 最贵但长上下文是独门武器: 200 万字符超长上下文。

Coding Plan 本质是"套餐包": API请求次数≠Token,容易产生混淆。

🆚 三、国内外横向对比

3.1 入门级性价比对决(折算为人民币/百万Token)

排名平台模型输入输出综合成本
🥇🇨🇳 DeepSeekV4 Flash~¥1.0~¥2.0极致低价
🥈🌍 Google2.5 Flash-Lite¥0.73¥2.9全球最低公开价
🥉🇨🇳 字节豆包豆包-Lite¥2.2¥4.3国内第二
4🌍 OpenAIGPT-4o Mini¥1.1¥4.3老牌性价比

3.2 旗舰级对决

排名平台模型输入输出性能
🥇🇨🇳 DeepSeekV4 Pro$1.74$3.48⭐⭐⭐⭐⭐ 编程/推理
🥈🌍 OpenAIGPT-4.1$5.00$15.00⭐⭐⭐⭐⭐ 全能
🥉🌍 GoogleGemini 3.1 Pro$2.00-4.00$12.00-18.00⭐⭐⭐⭐⭐ 多模态
4🇨🇳 通义千问Qwen-Max~$0.55~$1.65⭐⭐⭐⭐⭐ 中文
5🌍 AnthropicClaude Opus 4.6$5.00$25.00⭐⭐⭐⭐⭐ 推理最强

💡 国内外对比关键洞察

国内价格优势巨大: DeepSeek V4 Pro 输入仅为 GPT-4.1 的 35%,输出仅 23%。

Google Gemini 在入门级最能打: 2.5 Flash-Lite 以 $0.10 全球最低价杀入。

DeepSeek 是"价格屠夫": V4 Flash 缓存命中 $0.0028,比 Google 还便宜 97%。

国产旗舰≠国际旗舰性能: 价格虽低,但在复杂推理、代码竞赛上国际旗舰仍领先 5-15%。

🎯 四、场景化推荐

💻 AI 编程 / 日常开发

首选: DeepSeek V4 Pro / V3

编程能力国内最强,价格全球最低。配合 Cursor / Continue.dev。

月费预估:¥100-200

📚 长文档分析 / 知识库

首选: Kimi K2 / Gemini 2.5 Pro

Kimi 200万字符超长上下文,Gemini 2M Token。

月费预估:¥50-200

🖼️ 多模态 / 图片理解

首选: Google Gemini / 通义千问 Qwen-Max

Gemini 原生多模态最强,Qwen-Max 中文图文理解出色。

月费预估:¥200-500

🏭 企业级生产部署

首选: GPT-4.1 / Claude Opus 4.6

最稳定的 API、最完善的文档、最高质量的输出。

月费预估:$500-5000+

💰 极低成本 / 个人项目

首选: Google Gemini 2.5 Flash-Lite / DeepSeek V4 Flash

配合缓存命中,百万Token仅需几分钱。

月费预估:¥10-50

🔀 多模型网关 / 自由调度

首选: OpenRouter / One API

统一接入多平台,按需切换,自动故障转移。

注意:OpenRouter 有 10-20% 手续费

🛠️ 五、Token 省钱实操技巧

1. 缓存是最大的省钱工具

DeepSeek 缓存命中折扣 90-98%,OpenAI 减 90%。设计缓存友好的请求结构能省 60-80%。

2. Batch API 半价

OpenAI、Anthropic、Google 都提供 Batch API(异步批量处理),价格 50%。非实时场景必用。

3. 选对模型规模

简单任务用 Mini/Lite/Flash 模型,成本是旗舰模型的 1/10-1/20。

4. 开源模型自部署

Llama 4、Mistral、DeepSeek 开源。高流量业务自部署成本可降至 1/100。

5. 多模型混合策略

简单问答用 Flash-Lite,复杂推理用 GPT-4.1 或 Claude。混合调度可省 70% 成本。

📋 附录:完整价格速查表

平台入门模型输入 ($/1M)输出 ($/1M)特色
🧊 DeepSeek V4 Flash极低成本$0.14 (缓存$0.0028)$0.28🌈 全球最低价
🧊 DeepSeek V3经典$0.28 (缓存$0.028)$0.42🌈 极致性价比
🧊 DeepSeek V4 Pro旗舰$1.74 (缓存$0.0145)$3.48⚡ 编程之王
🌀 Gemini 2.5 Flash-Lite超轻量$0.10$0.40🌍 全球最便宜公开模型
🌀 Gemini 2.5 Flash轻量$0.15$0.60🔥 速度成本完美平衡
🌀 Gemini 3.1 Pro旗舰$2.00-4.00$12.00-18.00🧠 旗舰推理
⚡ GPT-4o Mini轻量$0.15$0.60🔥 老牌经典性价比
⚡ GPT-4.1 Mini新款入门$0.40$1.60🆕 新一代
⚡ GPT-4.1旗舰$5.00$15.00🚀 最新推荐
🐺 Claude Haiku 4.5轻量$0.80$4.00⚡ 轻量快速
🐺 Claude Sonnet 4.6主力$3.00$15.00⭐ 主力模型
🐺 Claude Opus 4.6旗舰$5.00$25.00🏆 最强推理
🤖 Mistral Large 2旗舰$4.00$12.00🇪🇺 欧洲最佳
📦 Amazon Nova Lite轻量$0.06$0.24💵 AWS最低价
📦 Amazon Nova Pro旗舰$0.80$3.20☁️ AWS原生
* 汇率按 1 USD ≈ 7.25 CNY 计算 · 数据截至 2026年5月 · 以官方实时价格为准

🏆 最终推荐

个人开发者(预算敏感): DeepSeek V4 Flash + Google Gemini 2.5 Flash-Lite 双模型,月费 <¥50。

产品/PoC(稳定质量): DeepSeek V4 Pro + GPT-4.1 Mini 混合调度,月费 ¥100-500。

企业生产(质量第一): GPT-4.1 + Claude Opus 4.6 + 通义千问 Qwen-Max 三模型,月费 $500-5000。

多模型管理: 使用 OpenRouter / One API 统一管理,有效降低 30-70% 成本。