大模型 API 定价
探索我们模型 API 的定价。通过透明的费率和灵活的选项,找到适合您需求的正确方案。
探索我们模型 API 的定价。通过透明的费率和灵活的选项,找到适合您需求的正确方案。
探索我们模型 API 的定价。通过透明的费率和灵活的选项,找到适合您需求的正确方案。
Anthropic的Claude模型提供先进的安全AI能力,专注于有用、无害、诚实的AI助手,具有强大的推理和对话能力。
| 模型名称 | Input Token Range | 上下文 | 输入(/Mt) | 缓存写入(/Mt) | 缓存读取(/Mt) | 输出(/Mt) | Actions |
|---|---|---|---|---|---|---|---|
| claude-sonnet-4-6 | 1-200,000 | 1,000,000 | $3 | $3.75(5m)·$6(1h) | $0.3 | $15 | 去体验 |
| 200,000-1,000,000 | 1,000,000 | $3 | $3.75(5m)·$6(1h) | $0.3 | $15 | 去体验 | |
| claude-opus-4-6 | 1-200,000 | 1,000,000 | $5 | $6.25(5m)·$10(1h) | $0.5 | $25 | 去体验 |
| 200,000-1,000,000 | 1,000,000 | $5 | $6.25(5m)·$10(1h) | $0.5 | $25 | 去体验 | |
| claude-opus-4-5-20251101 | - | 200,000 | $4.5$5 | $5.625(5m)·$9(1h)$6.25(5m)·$10(1h) | $0.45$0.5 | $22.5$25 | 去体验 |
| claude-haiku-4-5-20251001 | - | 20,000 | $0.9$1 | $1.125(5m)·$1.8(1h)$1.25(5m)·$2(1h) | $0.09$0.1 | $4.5$5 | 去体验 |
| claude-sonnet-4-5-20250929 | 1-200,000 | 200,000 | $3 | $3.75(5m)·$6(1h) | $0.3 | $15 | 去体验 |
| 200,000-1,000,000 | 200,000 | $6 | $7.5(5m)·$12(1h) | $0.6 | $22.5 | 去体验 | |
| claude-3-7-sonnet-20250219 | - | 200,000 | $2.7$3 | $3.375(5m)$3.75(5m) | $0.27$0.3 | $13.5$15 | 去体验 |
| claude-sonnet-4-20250514 | - | 200,000 | $2.7$3 | $3.375(5m)$3.75(5m) | $0.27$0.3 | $13.5$15 | 去体验 |
| claude-opus-4-20250514 | - | 200,000 | $13.5$15 | $16.875(5m)$18.75(5m) | $1.35$1.5 | $67.5$75 | 去体验 |
| claude-opus-4-1-20250805 | - | 200,000 | $13.5$15 | $16.875(5m)$18.75(5m) | $1.35$1.5 | $67.5$75 | 去体验 |
| claude-3-5-sonnet-20241022 | - | 200,000 | $2.7$3 | $3.375(5m)$3.75(5m) | $0.27$0.3 | $13.5$15 | 去体验 |
| claude-3-haiku-20240307 | - | 200,000 | $0.225$0.25 | - | - | $1.125$1.25 | 去体验 |
| claude-3-5-haiku-20241022 | - | 200,000 | $0.72$0.8 | - | - | $3.6$4 | 去体验 |
OpenAI的GPT系列模型提供最先进的语言理解和生成能力,在多种任务中表现出色,是业界领先的AI模型。
| 模型名称 | Input Token Range | 上下文 | 输入(/Mt) | 缓存读取(/Mt) | 输出(/Mt) | Actions |
|---|---|---|---|---|---|---|
| gpt-5.4-pro | 1-272,000 | 1,050,000 | $30 | - | $180 | 去体验 |
| 272,000-1,050,000 | 1,050,000 | $60 | - | $270 | 去体验 | |
| gpt-5.4 | 1-272,000 | 1,050,000 | $2.5 | $0.25 | $15 | 去体验 |
| 272,000-1,050,000 | 1,050,000 | $5 | $0.5 | $22.5 | 去体验 | |
| gpt-5.3-codex | - | 400,000 | $1.75 | $0.175 | $14 | 去体验 |
| gpt-5.3-chat-latest | - | 128,000 | $1.75 | $0.175 | $14 | 去体验 |
| gpt-5.2 | - | 400,000 | $1.575$1.75 | $0.1575$0.175 | $12.6$14 | 去体验 |
| gpt-5.1 | - | 400,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| openai/gpt-oss-120b | - | 131,072 | $0.1 | - | $0.5 | 去体验 |
| gpt-5-codex | - | 400,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| openai/gpt-oss-20b | - | 131,072 | $0.05 | - | $0.2 | 去体验 |
| gpt-5.1-chat-latest | - | 128,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| gpt-5 | - | 400,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| gpt-5-mini | - | 400,000 | $0.225$0.25 | $0.0225$0.025 | $1.8$2 | 去体验 |
| gpt-5-nano | - | 400,000 | $0.045$0.05 | $0.0045$0.005 | $0.36$0.4 | 去体验 |
| gpt-5-pro | - | 400,000 | $13.5$15 | - | $108$120 | 去体验 |
| gpt-5.2-codex | - | 400,000 | $1.75 | $0.175 | $14 | 去体验 |
| gpt-5.2-pro | - | 400,000 | $18.9$21 | - | $151.2$168 | 去体验 |
| gpt-5.2-chat-latest | - | 128,000 | $1.575$1.75 | $0.1575$0.175 | $12.6$14 | 去体验 |
| gpt-5.1-codex-max | - | 400,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| gpt-5.1-codex-mini | - | 400,000 | $0.225$0.25 | $0.0225$0.025 | $1.8$2 | 去体验 |
| gpt-5.1-codex | - | 400,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| gpt-5-chat-latest | - | 400,000 | $1.125$1.25 | $0.1125$0.125 | $9$10 | 去体验 |
| gpt-4.1-mini | - | 1,047,576 | $0.36$0.4 | $0.09$0.1 | $1.44$1.6 | 去体验 |
| gpt-4.1-nano | - | 1,047,576 | $0.09$0.1 | $0.0225$0.025 | $0.36$0.4 | 去体验 |
| gpt-4.1 | - | 1,047,576 | $1.8$2 | $0.45$0.5 | $7.2$8 | 去体验 |
| gpt-4o-mini | - | 128,000 | $0.135$0.15 | $0.0675$0.075 | $0.54$0.6 | 去体验 |
| gpt-4o | - | 131,072 | $2.25$2.5 | $1.125$1.25 | $9$10 | 去体验 |
Google的Gemini模型提供高质量的语言处理能力,在各种NLP任务中表现出色,具有强大的多模态能力。
| 模型名称 | Input Token Range | 上下文 | 输入(/Mt) | 缓存写入(/Mt) | 缓存读取(/Mt) | 输出(/Mt) | Actions |
|---|---|---|---|---|---|---|---|
| gemini-3.1-flash-lite-preview | - | 1,048,576 | $0.25 | $0.0833(5m) | $0.025 | $1.5 | 去体验 |
| gemini-3.1-pro-preview | 1-204,800 | 1,048,576 | $2 | $0.375(5m) | $0.2 | $12 | 去体验 |
| 204,800-1,048,576 | 1,048,576 | $4 | $0.375(5m) | $0.4 | $18 | 去体验 | |
| google/gemma-3-12b-it | - | 131,072 | $0.05 | - | - | $0.1 | 去体验 |
| gemini-2.5-flash | - | 1,048,576 | $0.27$0.3 | - | $0.0675$0.075 | $2.25$2.5 | 去体验 |
| gemini-3-flash-preview | - | 1,048,576 | $0.5 | - | $0.05 | $3 | 去体验 |
| gemini-3-pro-preview | 1-204,800 | 1,048,576 | $1.8$2 | - | $0.18$0.2 | $10.8$12 | 去体验 |
| 204,800-1,048,576 | 1,048,576 | $3.6$4 | - | $0.36$0.4 | $16.2$18 | 去体验 | |
| gemini-2.5-flash-lite-preview-09-2025 | - | 1,048,576 | $0.09$0.1 | - | $0.009$0.01 | $0.36$0.4 | 去体验 |
| gemini-2.0-flash-lite | - | 1,048,576 | $0.0675$0.075 | - | - | $0.27$0.3 | 去体验 |
| gemini-2.5-flash-lite | - | 1,048,576 | $0.09$0.1 | - | $0.0225$0.025 | $0.36$0.4 | 去体验 |
| gemini-2.5-pro | - | 1,048,576 | $1.125$1.25 | - | $0.2812$0.3125 | $9$10 | 去体验 |
| gemini-2.5-flash-lite-preview-06-17 | - | 1,048,576 | $0.09$0.1 | - | - | $0.36$0.4 | 去体验 |
| gemini-2.5-flash-preview-05-20 | - | 1,048,576 | $0.135$0.15 | - | - | $3.15$3.5 | 去体验 |
| gemini-2.5-pro-preview-06-05 | - | 1,048,576 | $1.125$1.25 | - | - | $9$10 | 去体验 |
| gemini-2.0-flash-20250609 | - | 1,048,576 | $0.135$0.15 | - | - | $0.54$0.6 | 去体验 |
| google/gemma-3-27b-it | - | 32,768 | $0.119 | - | - | $0.2 | 去体验 |
Meta的Llama模型提供最先进的语言理解能力,采用开放架构设计,适用于多样化应用场景。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| meta-llama/llama-4-maverick-17b-128e-instruct-fp8 | 1,048,576 | $0.17 | $0.85 | 去体验 |
| meta-llama/llama-4-scout-17b-16e-instruct | 131,072 | $0.1 | $0.5 | 去体验 |
| meta-llama/llama-3.3-70b-instruct | 131,072 | $0.13 | $0.39 | 去体验 |
| meta-llama/llama-3.2-3b-instruct | 32,768 | $0.03 | $0.05 | 去体验 |
| meta-llama/llama-3.1-8b-instruct | 16,384 | $0.02 | $0.05 | 去体验 |
Qwen系列模型提供高效的语言处理能力,具有多种参数规模,从轻量级到企业级解决方案。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| qwen/qwen3-235b-a22b-thinking-2507 | 131,072 | $0.3 | $3 | 去体验 |
| qwen/qwen3-coder-480b-a35b-instruct | 262,144 | $0.29 | $1.2 | 去体验 |
| qwen/qwen3-235b-a22b-instruct-2507 | 131,072 | $0.15 | $0.8 | 去体验 |
| qwen/qwen3-coder-next | 262,144 | $0.2 | $1.5 | 去体验 |
| qwen/qwen3-next-80b-a3b-instruct | 65,536 | $0.15 | $1.5 | 去体验 |
| qwen/qwen3-next-80b-a3b-thinking | 65,536 | $0.15 | $1.5 | 去体验 |
| qwen/qwen-mt-plus | 4,096 | $0.25 | $0.75 | 去体验 |
| qwen/qwen3-32b-fp8 | 40,960 | $0.1 | $0.45 | 去体验 |
| qwen/qwen3-30b-a3b-fp8 | 40,960 | $0.09 | $0.45 | 去体验 |
| qwen/qwen3-235b-a22b-fp8 | 40,960 | $0.2 | $0.8 | 去体验 |
| qwen/qwen2.5-7b-instruct | 32,000 | $0.07 | $0.07 | 去体验 |
| qwen/qwen2.5-vl-72b-instruct | 32,768 | $0.8 | $0.8 | 去体验 |
| qwen/qwen-2.5-72b-instruct | 32,000 | $0.38 | $0.4 | 去体验 |
百度的ERNIE模型提供先进的中文语言理解和多模态能力,针对中文应用进行了优化,具有竞争力的价格。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| baidu/ernie-4.5-vl-424b-a47b | 123,000 | $0.42 | $1.25 | 去体验 |
| baidu/ernie-4.5-300b-a47b-paddle | 123,000 | $0.28 | $1.1 | 去体验 |
来自清华大学的GLM系列模型,具有先进的中文语言理解和生成能力。
| 模型名称 | 上下文 | 输入(/Mt) | 缓存读取(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|---|
| zai-org/glm-4.5v | 65,536 | $0.6 | - | $1.8 | 去体验 |
| zai-org/glm-4.5 | 131,072 | $0.6 | - | $2.2 | 去体验 |
| zai-org/glm-5 | 204,800 | $1 | $0.2 | $3.2 | 去体验 |
| zai-org/glm-ocr | 32,000 | $0.03 | - | $0.03 | 去体验 |
| zai-org/glm-4.7-flash | 200,000 | $0.07 | $0.01 | $0.4 | 去体验 |
| zai-org/glm-4.7 | 204,800 | $0.6 | - | $2.2 | 去体验 |
专门针对创意和角色扮演应用优化的微调模型,具有增强的故事叙述能力。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| Sao10K/L3-8B-Stheno-v3.2 | 8,192 | $0.05 | $0.05 | 去体验 |
| sao10k/l3-8b-lunaris | 8,192 | $0.05 | $0.05 | 去体验 |
| sao10k/l31-70b-euryale-v2.2 | 8,192 | $1.48 | $1.48 | 去体验 |
| sao10k/l3-70b-euryale-v2.1 | 8,192 | $1.48 | $1.48 | 去体验 |
来自Mistral AI的高效强大语言模型,专为商业和开源应用而设计。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| mistralai/mistral-7b-instruct | 32,768 | $0.029 | $0.059 | 去体验 |
| mistralai/mistral-nemo | 60,288 | $0.04 | $0.17 | 去体验 |
来自DeepSeek的先进AI模型,为企业级和研究应用提供前沿的推理能力和具有竞争力的价格。
| 模型名称 | 上下文 | 输入(/Mt) | 缓存写入(/Mt) | 缓存读取(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|---|---|
| deepseek/deepseek-v3.1 | 163,840 | $0.27 | - | - | $1 | 去体验 |
| deepseek/deepseek-ocr-2 | 8,192 | $0.03 | - | - | $0.03 | 去体验 |
| deepseek/deepseek-r1-0528 | 163,840 | $0.7 | - | $0.35 | $2.5 | 去体验 |
| deepseek/deepseek-v3-0324 | 163,840 | $0.28 | $0.14(5m) | $0.14 | $1.14 | 去体验 |
MiniMax AI的先进语言模型提供强大的对话AI能力,在客户服务、内容生成和创意应用中表现优异,具有强大的多语言支持和企业级可扩展性。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| minimaxai/minimax-m1-80k | 1,000,000 | $0.55 | $2.2 | 去体验 |
来自Gryphe的创新AI模型,提供专业的语言理解能力,专注于效率和适应性,适用于利基应用。
| 模型名称 | 上下文 | 输入(/Mt) | 输出(/Mt) | 操作 |
|---|---|---|---|---|
| gryphe/mythomax-l2-13b | 4,096 | $0.09 | $0.09 | 去体验 |
最先进AI模型的高级集合,具有高级推理、数学证明能力和跨多个领域的前沿语言理解能力。