2026年国内外AI大模型Token定价方案对比报告

📊 核心数据速览

$0.028

输入价格最低（DeepSeek V4 Flash 缓存命中/百万Token）

¥0.2

国内入门级最低（DeepSeek V3 输入/百万Token）

$150

输出价格最高（Claude Opus 4.6 Fast / 百万Token）

$0.10

全球最便宜入门（Gemini 2.5 Flash-Lite / 百万Token）

🌍 一、国外平台定价方案

1.1 OpenAI

模型	输入 (每百万Token)	输出 (每百万Token)	上下文	备注
GPT-4.1	$5.00	$15.00	1M	最新推荐生产模型
GPT-4.1 Mini	$0.40	$1.60	1M	高性价比
GPT-4o (遗留)	$2.50 好	$10.00	128K	老用户可继续使用
GPT-4o Mini	$0.15	$0.60	128K	成本优化选择
GPT-5	$1.25	$10.00	-	最新旗舰
GPT-5 Mini	$0.25	$2.00	-	轻量级
✅ Batch API 5折 · Prompt Caching 最高减 90% · o3 推理模型 $10/$40

1.2 Anthropic (Claude)

模型	输入 (每百万Token)	输出 (每百万Token)	上下文	备注
Claude Opus 4.6	$5.00	$25.00	200K	最强推理
Claude Opus 4.6 (Fast)	$30.00	$150.00	200K	🔥 全表最高价
Claude Sonnet 4.6	$3.00	$15.00	200K	主力模型
Claude Haiku 4.5	$0.80	$4.00	200K	轻量模型
✅ Batch API 5折 · Prompt Caching · 工具调用/代码执行额外计费 · 超 200K 输入加价

📌 Claude 订阅计划

Pro $20/月 · Max $100-200/月 · Team Standard $25/座/月 · Team Premium $125/座/月 · Enterprise 定制（约 $50,000/年起）

1.3 Google Gemini

模型	输入 (每百万Token)	输出 (每百万Token)	上下文	备注
Gemini 3.1 Pro	$2.00 - $4.00	$12.00 - $18.00	2M	旗舰推理
Gemini 3.1 Flash-Lite	$0.25	$1.50	1M	新款性价比之选
Gemini 3 Flash	$0.50	$2.00	1M	速度均衡
Gemini 2.5 Flash	$0.15	$0.60	1M	高性价比
Gemini 2.5 Flash-Lite	$0.10	$0.40	1M	🥇 全球最低价
Gemini 2.5 Pro	$1.25 - $2.50	$5.00 - $10.00	2M	上代旗舰
✅ 免费层：2.5 Pro 每日 1500 次接地请求 · 上下文高达 2M Token · 原生多模态

1.4 其他国外重要平台

🤖 Mistral AI

Mistral Large 2$4.00 / $12.00

Mistral Small$0.50 / $1.50

Codestral$4.00 / $12.00

Apache 2.0 · 开源可自部署

🦙 Meta Llama

Llama 4 Scout开源免费

Llama 4 Maverick开源免费

Together/Groq 等平台托管

⚡ Grok (xAI)

Grok-3xAI API 按需

X Premium+ 含 Grok

🧠 Amazon Bedrock

Nova Pro$0.80 / $3.20

Nova Lite$0.06 / $0.24

AWS 整合 · 企业级安全

1.5 国外平台价格总览（每百万 Token，美元）

排名	平台	性价比款	输入	输出	评价
🥇	Google	Gemini 2.5 Flash-Lite	$0.10	$0.40	全球最低
🥈	OpenAI	GPT-4o Mini	$0.15	$0.60	极高性价比
🥉	Google	Gemini 2.5 Flash	$0.15	$0.60	与GPT-4o Mini持平
4	OpenAI	GPT-4.1 Mini	$0.40	$1.60	新一代性价比
5	Anthropic	Haiku 4.5	$0.80	$4.00	轻量快速
6	Google	Gemini 3 Flash	$0.50	$2.00	速度均衡
7	Amazon	Nova Pro	$0.80	$3.20	AWS原生
8	OpenAI	GPT-4o	$2.50	$10.00	遗留但依然强
9	Anthropic	Sonnet 4.6	$3.00	$15.00	主力模型
10	Mistral	Large 2	$4.00	$12.00	欧洲最佳
11	OpenAI	GPT-4.1	$5.00	$15.00	最新旗舰
12	Anthropic	Opus 4.6	$5.00	$25.00	最强推理

💡 国外平台关键洞察

❶ 价格战白热化： Google Gemini 2.5 Flash-Lite 以 $0.10/$0.40 创全球全类型模型最低价。

❷ 性价比断层： 入门模型 ($0.10-0.80) 与旗舰模型 ($3-25) 之间 10~50 倍差距。

❸ Anthropic 最贵但最稳： Opus 系列在复杂推理、编程方面仍是标杆。

❹ Hidden Cost： 工具调用、代码执行、超长上下文额外加价，实际账单可能高 30-50%。

🇨🇳 二、国内平台定价方案

2.1 DeepSeek（深度求索）

模型	输入-缓存未命中	输入-缓存命中	输出	上下文	备注
DeepSeek V4 Pro (常规)	$1.74	$0.0145	$3.48	1M	旗舰推理
DeepSeek V4 Pro (促销)	$0.435	$0.0036	$0.87	1M	75% 折扣
DeepSeek V4 Flash	$0.14	$0.0028	$0.28	1M	🥇 全球输入最低
DeepSeek V3 (Chat/Reasoner)	¥0.2 / $0.28	¥0.02 / $0.028	¥0.8 / $0.42	128K	国内市场经典
✅ 上下文缓存默认开启（缓存命中 90% 折扣）· MoE 架构 · OpenAI 兼容接口

2.2 国内平台 Token 价格横向对比（入门级，人民币/百万Token）

排名	平台	入门模型	输入	输出	100元可得Token	免费额度
🥇	字节豆包	豆包-Lite	¥0.30	¥0.60	~2.2亿	100万/月
🥇	DeepSeek	DeepSeek-V3	¥0.20	¥0.80	~2亿	无
🥉	通义千问	Qwen-Turbo	¥0.50	¥1.00	~1.33亿	7000万(一次性)
🥉	智谱GLM	GLM-Edge	¥0.50	¥1.00	~1.33亿	100万(一次性)
5	腾讯混元	混元-Lite	¥0.60	¥1.20	~1.11亿	无
5	讯飞星火	星火-Lite	¥0.60	¥1.20	~1.11亿	5万/月
7	华为盘古	盘古-Lite	¥0.80	¥1.50	~0.87亿	无
7	MiniMax	MiniMax-Lite	¥0.80	¥1.50	~0.87亿	5万/月
9	文心一言	文心-Speed	¥0.80	¥1.60	~0.83亿	5万/月
10	Kimi (月之暗面)	Kimi-Small	¥1.00	¥2.00	~0.67亿	10万/月

2.3 国内平台旗舰级价格对比（换算为美元/百万Token，1 USD ≈ 7.25 CNY）

平台	旗舰模型	输入	输出	质量评价
DeepSeek	V4 Pro	$1.74	$3.48	⭐⭐⭐⭐⭐ 编程首选
字节豆包	豆包-Pro	~$0.55	~$1.65	⭐⭐⭐⭐ 多模态强
通义千问	Qwen-Max	~$0.55	~$1.65	⭐⭐⭐⭐⭐ 中文最佳
智谱GLM	GLM-4-Plus	~$0.69	~$2.07	⭐⭐⭐⭐ 推理强
文心一言	ERNIE-4.5	~$0.83	~$2.76	⭐⭐⭐⭐ 知识丰富
腾讯混元	混元-Pro	~$0.69	~$2.07	⭐⭐⭐⭐ 生态好
Kimi	Kimi-K2	~$1.10	~$3.31	⭐⭐⭐⭐ 长上下文强
华为盘古	盘古-Pro	~$0.83	~$2.76	⭐⭐⭐ 企业级

2.4 国内 Coding Plan 订阅套餐对比

平台	入门月价	计费单位	核心额度	支持模型
阿里云百炼	¥49/首月	API请求次数	1万次/月	Qwen-Max, Qwen-Coder
火山方舟（字节）	¥49/首月	API请求次数	1万次/月	豆包-Pro, DeepSeek-V3
智谱GLM	¥50/月	Prompt次数	500次Prompt	GLM-4-Plus, CodeGeeX
Kimi (月之暗面)	¥50/月	Token	限时3倍额度	Kimi-K2
MiniMax	¥69/月	Prompt次数	标准额度	MiniMax-Text
无问芯穹	¥199/起	API请求次数	专业级	多模型网关

💡 国内平台关键洞察

❶ DeepSeek 断层式领先： 入门级 ¥0.2/百万Token，旗舰级也仅 $1.74/$3.48。

❷ 字节豆包最慷慨： 综合单价最低（¥0.45/百万Token），100元可得 2.2亿 Token。

❸ 通义千问综合实力强： 旗舰 Qwen-Max 中文理解能力国内顶尖，价格适中。

❹ Kimi 最贵但长上下文是独门武器： 200 万字符超长上下文。

❺ Coding Plan 本质是"套餐包"： API请求次数≠Token，容易产生混淆。

🆚 三、国内外横向对比

3.1 入门级性价比对决（折算为人民币/百万Token）

排名	平台	模型	输入	输出	综合成本
🥇	🇨🇳 DeepSeek	V4 Flash	~¥1.0	~¥2.0	极致低价
🥈	🌍 Google	2.5 Flash-Lite	¥0.73	¥2.9	全球最低公开价
🥉	🇨🇳 字节豆包	豆包-Lite	¥2.2	¥4.3	国内第二
4	🌍 OpenAI	GPT-4o Mini	¥1.1	¥4.3	老牌性价比

3.2 旗舰级对决

排名	平台	模型	输入	输出	性能
🥇	🇨🇳 DeepSeek	V4 Pro	$1.74	$3.48	⭐⭐⭐⭐⭐ 编程/推理
🥈	🌍 OpenAI	GPT-4.1	$5.00	$15.00	⭐⭐⭐⭐⭐ 全能
🥉	🌍 Google	Gemini 3.1 Pro	$2.00-4.00	$12.00-18.00	⭐⭐⭐⭐⭐ 多模态
4	🇨🇳 通义千问	Qwen-Max	~$0.55	~$1.65	⭐⭐⭐⭐⭐ 中文
5	🌍 Anthropic	Claude Opus 4.6	$5.00	$25.00	⭐⭐⭐⭐⭐ 推理最强

💡 国内外对比关键洞察

❶ 国内价格优势巨大： DeepSeek V4 Pro 输入仅为 GPT-4.1 的 35%，输出仅 23%。

❷ Google Gemini 在入门级最能打： 2.5 Flash-Lite 以 $0.10 全球最低价杀入。

❸ DeepSeek 是"价格屠夫"： V4 Flash 缓存命中 $0.0028，比 Google 还便宜 97%。

❹ 国产旗舰≠国际旗舰性能： 价格虽低，但在复杂推理、代码竞赛上国际旗舰仍领先 5-15%。

🎯 四、场景化推荐

💻 AI 编程 / 日常开发

首选： DeepSeek V4 Pro / V3

编程能力国内最强，价格全球最低。配合 Cursor / Continue.dev。

月费预估：¥100-200

📚 长文档分析 / 知识库

首选： Kimi K2 / Gemini 2.5 Pro

Kimi 200万字符超长上下文，Gemini 2M Token。

月费预估：¥50-200

🖼️ 多模态 / 图片理解

首选： Google Gemini / 通义千问 Qwen-Max

Gemini 原生多模态最强，Qwen-Max 中文图文理解出色。

月费预估：¥200-500

🏭 企业级生产部署

首选： GPT-4.1 / Claude Opus 4.6

最稳定的 API、最完善的文档、最高质量的输出。

月费预估：$500-5000+

💰 极低成本 / 个人项目

首选： Google Gemini 2.5 Flash-Lite / DeepSeek V4 Flash

配合缓存命中，百万Token仅需几分钱。

月费预估：¥10-50

🔀 多模型网关 / 自由调度

首选： OpenRouter / One API

统一接入多平台，按需切换，自动故障转移。

注意：OpenRouter 有 10-20% 手续费

🛠️ 五、Token 省钱实操技巧

1. 缓存是最大的省钱工具

DeepSeek 缓存命中折扣 90-98%，OpenAI 减 90%。设计缓存友好的请求结构能省 60-80%。

2. Batch API 半价

OpenAI、Anthropic、Google 都提供 Batch API（异步批量处理），价格 50%。非实时场景必用。

3. 选对模型规模

简单任务用 Mini/Lite/Flash 模型，成本是旗舰模型的 1/10-1/20。

4. 开源模型自部署

Llama 4、Mistral、DeepSeek 开源。高流量业务自部署成本可降至 1/100。

5. 多模型混合策略

简单问答用 Flash-Lite，复杂推理用 GPT-4.1 或 Claude。混合调度可省 70% 成本。

📋 附录：完整价格速查表

平台	入门模型	输入 ($/1M)	输出 ($/1M)	特色
🧊 DeepSeek V4 Flash	极低成本	$0.14 (缓存$0.0028)	$0.28	🌈 全球最低价
🧊 DeepSeek V3	经典	$0.28 (缓存$0.028)	$0.42	🌈 极致性价比
🧊 DeepSeek V4 Pro	旗舰	$1.74 (缓存$0.0145)	$3.48	⚡ 编程之王
🌀 Gemini 2.5 Flash-Lite	超轻量	$0.10	$0.40	🌍 全球最便宜公开模型
🌀 Gemini 2.5 Flash	轻量	$0.15	$0.60	🔥 速度成本完美平衡
🌀 Gemini 3.1 Pro	旗舰	$2.00-4.00	$12.00-18.00	🧠 旗舰推理
⚡ GPT-4o Mini	轻量	$0.15	$0.60	🔥 老牌经典性价比
⚡ GPT-4.1 Mini	新款入门	$0.40	$1.60	🆕 新一代
⚡ GPT-4.1	旗舰	$5.00	$15.00	🚀 最新推荐
🐺 Claude Haiku 4.5	轻量	$0.80	$4.00	⚡ 轻量快速
🐺 Claude Sonnet 4.6	主力	$3.00	$15.00	⭐ 主力模型
🐺 Claude Opus 4.6	旗舰	$5.00	$25.00	🏆 最强推理
🤖 Mistral Large 2	旗舰	$4.00	$12.00	🇪🇺 欧洲最佳
📦 Amazon Nova Lite	轻量	$0.06	$0.24	💵 AWS最低价
📦 Amazon Nova Pro	旗舰	$0.80	$3.20	☁️ AWS原生
* 汇率按 1 USD ≈ 7.25 CNY 计算 · 数据截至 2026年5月 · 以官方实时价格为准

🏆 最终推荐

个人开发者（预算敏感）： DeepSeek V4 Flash + Google Gemini 2.5 Flash-Lite 双模型，月费 <¥50。

产品/PoC（稳定质量）： DeepSeek V4 Pro + GPT-4.1 Mini 混合调度，月费 ¥100-500。

企业生产（质量第一）： GPT-4.1 + Claude Opus 4.6 + 通义千问 Qwen-Max 三模型，月费 $500-5000。

多模型管理： 使用 OpenRouter / One API 统一管理，有效降低 30-70% 成本。

2026年国内外 AI 大模型 Token 定价 方案对比报告