覆盖全球 15+ 主流平台 · 基于 2026年5月最新公开数据
📅 报告日期:2026-05-08| 模型 | 输入 (每百万Token) | 输出 (每百万Token) | 上下文 | 备注 |
|---|---|---|---|---|
| GPT-4.1 | $5.00 | $15.00 | 1M | 最新推荐生产模型 |
| GPT-4.1 Mini | $0.40 | $1.60 | 1M | 高性价比 |
| GPT-4o (遗留) | $2.50 好 | $10.00 | 128K | 老用户可继续使用 |
| GPT-4o Mini | $0.15 | $0.60 | 128K | 成本优化选择 |
| GPT-5 | $1.25 | $10.00 | - | 最新旗舰 |
| GPT-5 Mini | $0.25 | $2.00 | - | 轻量级 |
| ✅ Batch API 5折 · Prompt Caching 最高减 90% · o3 推理模型 $10/$40 | ||||
| 模型 | 输入 (每百万Token) | 输出 (每百万Token) | 上下文 | 备注 |
|---|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | 200K | 最强推理 |
| Claude Opus 4.6 (Fast) | $30.00 | $150.00 | 200K | 🔥 全表最高价 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K | 主力模型 |
| Claude Haiku 4.5 | $0.80 | $4.00 | 200K | 轻量模型 |
| ✅ Batch API 5折 · Prompt Caching · 工具调用/代码执行额外计费 · 超 200K 输入加价 | ||||
Pro $20/月 · Max $100-200/月 · Team Standard $25/座/月 · Team Premium $125/座/月 · Enterprise 定制(约 $50,000/年起)
| 模型 | 输入 (每百万Token) | 输出 (每百万Token) | 上下文 | 备注 |
|---|---|---|---|---|
| Gemini 3.1 Pro | $2.00 - $4.00 | $12.00 - $18.00 | 2M | 旗舰推理 |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | 1M | 新款性价比之选 |
| Gemini 3 Flash | $0.50 | $2.00 | 1M | 速度均衡 |
| Gemini 2.5 Flash | $0.15 | $0.60 | 1M | 高性价比 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1M | 🥇 全球最低价 |
| Gemini 2.5 Pro | $1.25 - $2.50 | $5.00 - $10.00 | 2M | 上代旗舰 |
| ✅ 免费层:2.5 Pro 每日 1500 次接地请求 · 上下文高达 2M Token · 原生多模态 | ||||
| 排名 | 平台 | 性价比款 | 输入 | 输出 | 评价 |
|---|---|---|---|---|---|
| 🥇 | Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 全球最低 | |
| 🥈 | OpenAI | GPT-4o Mini | $0.15 | $0.60 | 极高性价比 |
| 🥉 | Gemini 2.5 Flash | $0.15 | $0.60 | 与GPT-4o Mini持平 | |
| 4 | OpenAI | GPT-4.1 Mini | $0.40 | $1.60 | 新一代性价比 |
| 5 | Anthropic | Haiku 4.5 | $0.80 | $4.00 | 轻量快速 |
| 6 | Gemini 3 Flash | $0.50 | $2.00 | 速度均衡 | |
| 7 | Amazon | Nova Pro | $0.80 | $3.20 | AWS原生 |
| 8 | OpenAI | GPT-4o | $2.50 | $10.00 | 遗留但依然强 |
| 9 | Anthropic | Sonnet 4.6 | $3.00 | $15.00 | 主力模型 |
| 10 | Mistral | Large 2 | $4.00 | $12.00 | 欧洲最佳 |
| 11 | OpenAI | GPT-4.1 | $5.00 | $15.00 | 最新旗舰 |
| 12 | Anthropic | Opus 4.6 | $5.00 | $25.00 | 最强推理 |
❶ 价格战白热化: Google Gemini 2.5 Flash-Lite 以 $0.10/$0.40 创全球全类型模型最低价。
❷ 性价比断层: 入门模型 ($0.10-0.80) 与旗舰模型 ($3-25) 之间 10~50 倍差距。
❸ Anthropic 最贵但最稳: Opus 系列在复杂推理、编程方面仍是标杆。
❹ Hidden Cost: 工具调用、代码执行、超长上下文额外加价,实际账单可能高 30-50%。
| 模型 | 输入-缓存未命中 | 输入-缓存命中 | 输出 | 上下文 | 备注 |
|---|---|---|---|---|---|
| DeepSeek V4 Pro (常规) | $1.74 | $0.0145 | $3.48 | 1M | 旗舰推理 |
| DeepSeek V4 Pro (促销) | $0.435 | $0.0036 | $0.87 | 1M | 75% 折扣 |
| DeepSeek V4 Flash | $0.14 | $0.0028 | $0.28 | 1M | 🥇 全球输入最低 |
| DeepSeek V3 (Chat/Reasoner) | ¥0.2 / $0.28 | ¥0.02 / $0.028 | ¥0.8 / $0.42 | 128K | 国内市场经典 |
| ✅ 上下文缓存默认开启(缓存命中 90% 折扣)· MoE 架构 · OpenAI 兼容接口 | |||||
| 排名 | 平台 | 入门模型 | 输入 | 输出 | 100元可得Token | 免费额度 |
|---|---|---|---|---|---|---|
| 🥇 | 字节豆包 | 豆包-Lite | ¥0.30 | ¥0.60 | ~2.2亿 | 100万/月 |
| 🥇 | DeepSeek | DeepSeek-V3 | ¥0.20 | ¥0.80 | ~2亿 | 无 |
| 🥉 | 通义千问 | Qwen-Turbo | ¥0.50 | ¥1.00 | ~1.33亿 | 7000万(一次性) |
| 🥉 | 智谱GLM | GLM-Edge | ¥0.50 | ¥1.00 | ~1.33亿 | 100万(一次性) |
| 5 | 腾讯混元 | 混元-Lite | ¥0.60 | ¥1.20 | ~1.11亿 | 无 |
| 5 | 讯飞星火 | 星火-Lite | ¥0.60 | ¥1.20 | ~1.11亿 | 5万/月 |
| 7 | 华为盘古 | 盘古-Lite | ¥0.80 | ¥1.50 | ~0.87亿 | 无 |
| 7 | MiniMax | MiniMax-Lite | ¥0.80 | ¥1.50 | ~0.87亿 | 5万/月 |
| 9 | 文心一言 | 文心-Speed | ¥0.80 | ¥1.60 | ~0.83亿 | 5万/月 |
| 10 | Kimi (月之暗面) | Kimi-Small | ¥1.00 | ¥2.00 | ~0.67亿 | 10万/月 |
| 平台 | 旗舰模型 | 输入 | 输出 | 质量评价 |
|---|---|---|---|---|
| DeepSeek | V4 Pro | $1.74 | $3.48 | ⭐⭐⭐⭐⭐ 编程首选 |
| 字节豆包 | 豆包-Pro | ~$0.55 | ~$1.65 | ⭐⭐⭐⭐ 多模态强 |
| 通义千问 | Qwen-Max | ~$0.55 | ~$1.65 | ⭐⭐⭐⭐⭐ 中文最佳 |
| 智谱GLM | GLM-4-Plus | ~$0.69 | ~$2.07 | ⭐⭐⭐⭐ 推理强 |
| 文心一言 | ERNIE-4.5 | ~$0.83 | ~$2.76 | ⭐⭐⭐⭐ 知识丰富 |
| 腾讯混元 | 混元-Pro | ~$0.69 | ~$2.07 | ⭐⭐⭐⭐ 生态好 |
| Kimi | Kimi-K2 | ~$1.10 | ~$3.31 | ⭐⭐⭐⭐ 长上下文强 |
| 华为盘古 | 盘古-Pro | ~$0.83 | ~$2.76 | ⭐⭐⭐ 企业级 |
| 平台 | 入门月价 | 计费单位 | 核心额度 | 支持模型 |
|---|---|---|---|---|
| 阿里云百炼 | ¥49/首月 | API请求次数 | 1万次/月 | Qwen-Max, Qwen-Coder |
| 火山方舟(字节) | ¥49/首月 | API请求次数 | 1万次/月 | 豆包-Pro, DeepSeek-V3 |
| 智谱GLM | ¥50/月 | Prompt次数 | 500次Prompt | GLM-4-Plus, CodeGeeX |
| Kimi (月之暗面) | ¥50/月 | Token | 限时3倍额度 | Kimi-K2 |
| MiniMax | ¥69/月 | Prompt次数 | 标准额度 | MiniMax-Text |
| 无问芯穹 | ¥199/起 | API请求次数 | 专业级 | 多模型网关 |
❶ DeepSeek 断层式领先: 入门级 ¥0.2/百万Token,旗舰级也仅 $1.74/$3.48。
❷ 字节豆包最慷慨: 综合单价最低(¥0.45/百万Token),100元可得 2.2亿 Token。
❸ 通义千问综合实力强: 旗舰 Qwen-Max 中文理解能力国内顶尖,价格适中。
❹ Kimi 最贵但长上下文是独门武器: 200 万字符超长上下文。
❺ Coding Plan 本质是"套餐包": API请求次数≠Token,容易产生混淆。
| 排名 | 平台 | 模型 | 输入 | 输出 | 综合成本 |
|---|---|---|---|---|---|
| 🥇 | 🇨🇳 DeepSeek | V4 Flash | ~¥1.0 | ~¥2.0 | 极致低价 |
| 🥈 | 2.5 Flash-Lite | ¥0.73 | ¥2.9 | 全球最低公开价 | |
| 🥉 | 🇨🇳 字节豆包 | 豆包-Lite | ¥2.2 | ¥4.3 | 国内第二 |
| 4 | 🌍 OpenAI | GPT-4o Mini | ¥1.1 | ¥4.3 | 老牌性价比 |
| 排名 | 平台 | 模型 | 输入 | 输出 | 性能 |
|---|---|---|---|---|---|
| 🥇 | 🇨🇳 DeepSeek | V4 Pro | $1.74 | $3.48 | ⭐⭐⭐⭐⭐ 编程/推理 |
| 🥈 | 🌍 OpenAI | GPT-4.1 | $5.00 | $15.00 | ⭐⭐⭐⭐⭐ 全能 |
| 🥉 | Gemini 3.1 Pro | $2.00-4.00 | $12.00-18.00 | ⭐⭐⭐⭐⭐ 多模态 | |
| 4 | 🇨🇳 通义千问 | Qwen-Max | ~$0.55 | ~$1.65 | ⭐⭐⭐⭐⭐ 中文 |
| 5 | 🌍 Anthropic | Claude Opus 4.6 | $5.00 | $25.00 | ⭐⭐⭐⭐⭐ 推理最强 |
❶ 国内价格优势巨大: DeepSeek V4 Pro 输入仅为 GPT-4.1 的 35%,输出仅 23%。
❷ Google Gemini 在入门级最能打: 2.5 Flash-Lite 以 $0.10 全球最低价杀入。
❸ DeepSeek 是"价格屠夫": V4 Flash 缓存命中 $0.0028,比 Google 还便宜 97%。
❹ 国产旗舰≠国际旗舰性能: 价格虽低,但在复杂推理、代码竞赛上国际旗舰仍领先 5-15%。
首选: DeepSeek V4 Pro / V3
编程能力国内最强,价格全球最低。配合 Cursor / Continue.dev。
月费预估:¥100-200
首选: Kimi K2 / Gemini 2.5 Pro
Kimi 200万字符超长上下文,Gemini 2M Token。
月费预估:¥50-200
首选: Google Gemini / 通义千问 Qwen-Max
Gemini 原生多模态最强,Qwen-Max 中文图文理解出色。
月费预估:¥200-500
首选: GPT-4.1 / Claude Opus 4.6
最稳定的 API、最完善的文档、最高质量的输出。
月费预估:$500-5000+
首选: Google Gemini 2.5 Flash-Lite / DeepSeek V4 Flash
配合缓存命中,百万Token仅需几分钱。
月费预估:¥10-50
首选: OpenRouter / One API
统一接入多平台,按需切换,自动故障转移。
注意:OpenRouter 有 10-20% 手续费
DeepSeek 缓存命中折扣 90-98%,OpenAI 减 90%。设计缓存友好的请求结构能省 60-80%。
OpenAI、Anthropic、Google 都提供 Batch API(异步批量处理),价格 50%。非实时场景必用。
简单任务用 Mini/Lite/Flash 模型,成本是旗舰模型的 1/10-1/20。
Llama 4、Mistral、DeepSeek 开源。高流量业务自部署成本可降至 1/100。
简单问答用 Flash-Lite,复杂推理用 GPT-4.1 或 Claude。混合调度可省 70% 成本。
| 平台 | 入门模型 | 输入 ($/1M) | 输出 ($/1M) | 特色 |
|---|---|---|---|---|
| 🧊 DeepSeek V4 Flash | 极低成本 | $0.14 (缓存$0.0028) | $0.28 | 🌈 全球最低价 |
| 🧊 DeepSeek V3 | 经典 | $0.28 (缓存$0.028) | $0.42 | 🌈 极致性价比 |
| 🧊 DeepSeek V4 Pro | 旗舰 | $1.74 (缓存$0.0145) | $3.48 | ⚡ 编程之王 |
| 🌀 Gemini 2.5 Flash-Lite | 超轻量 | $0.10 | $0.40 | 🌍 全球最便宜公开模型 |
| 🌀 Gemini 2.5 Flash | 轻量 | $0.15 | $0.60 | 🔥 速度成本完美平衡 |
| 🌀 Gemini 3.1 Pro | 旗舰 | $2.00-4.00 | $12.00-18.00 | 🧠 旗舰推理 |
| ⚡ GPT-4o Mini | 轻量 | $0.15 | $0.60 | 🔥 老牌经典性价比 |
| ⚡ GPT-4.1 Mini | 新款入门 | $0.40 | $1.60 | 🆕 新一代 |
| ⚡ GPT-4.1 | 旗舰 | $5.00 | $15.00 | 🚀 最新推荐 |
| 🐺 Claude Haiku 4.5 | 轻量 | $0.80 | $4.00 | ⚡ 轻量快速 |
| 🐺 Claude Sonnet 4.6 | 主力 | $3.00 | $15.00 | ⭐ 主力模型 |
| 🐺 Claude Opus 4.6 | 旗舰 | $5.00 | $25.00 | 🏆 最强推理 |
| 🤖 Mistral Large 2 | 旗舰 | $4.00 | $12.00 | 🇪🇺 欧洲最佳 |
| 📦 Amazon Nova Lite | 轻量 | $0.06 | $0.24 | 💵 AWS最低价 |
| 📦 Amazon Nova Pro | 旗舰 | $0.80 | $3.20 | ☁️ AWS原生 |
| * 汇率按 1 USD ≈ 7.25 CNY 计算 · 数据截至 2026年5月 · 以官方实时价格为准 | ||||
个人开发者(预算敏感): DeepSeek V4 Flash + Google Gemini 2.5 Flash-Lite 双模型,月费 <¥50。
产品/PoC(稳定质量): DeepSeek V4 Pro + GPT-4.1 Mini 混合调度,月费 ¥100-500。
企业生产(质量第一): GPT-4.1 + Claude Opus 4.6 + 通义千问 Qwen-Max 三模型,月费 $500-5000。
多模型管理: 使用 OpenRouter / One API 统一管理,有效降低 30-70% 成本。