AI 网关 · 智能调度 一个 API
一个 API
调度 100+ 大模型
聚合 OpenAI、Claude、Gemini、DeepSeek、Qwen 等 40+ 上游服务商。改一行 baseURL 即接入,自动重试、配额管控、成本可视化,一站搞定。
兼容 OpenAI / Claude / Gemini SDK 99.9% 可用
50+
上游服务商
100+
可计费模型
50+
兼容 API 路由
99.9%
运行可用性
已接入
主流大模型 · 一处调度
OpenAI
Claude
Gemini
DeepSeek
Qwen
Doubao
MiniMax
Moonshot
Mistral
Cohere
Grok
Yi
Zhipu
Meta
OpenAI
Claude
Gemini
DeepSeek
Qwen
Doubao
MiniMax
Moonshot
Mistral
Cohere
Grok
Yi
Zhipu
Meta
核心特性
为生产级 AI 应用而生
01
智能路由 · 自动重试
基于权重的多渠道路由,单家失败自动切换;支持限速、降级与配额隔离,业务无感。
OpenAI Claude Gemini DeepSeek Qwen
02
透明计费
按 token 实时计费,缓存命中折扣自动识别,账单一行一目了然。
实时计费 token 计量 缓存折扣 多档识别
03
零迁移成本
OpenAI / Claude / Gemini SDK 直接复用,仅替换 baseURL 即接入。
baseURL: hivellm.io/v1
04
企业级安全
令牌分组、IP 白名单、模型黑白名单、审计日志全程留痕。
IP 白名单 令牌分组 审计日志 配额隔离
高并发
自动负载均衡,单实例 8000+ QPS。
可观测
Token / 请求 / 耗时 / 错误一图打通。
多租户
团队 / 项目 / 用户三级权限隔离。
可私有化
私有化部署、数据自主可控,不受任何供应商绑定。
透明价格
全模型 · 5.5 折起
所有大模型按 token 实时计费,各厂商对应折扣见下表,价格随上游官方同步调整。
5.5 折起
价格单位:¥ / 百万 tokens(含 USD 对照)
Claude
15 个模型 7.5 折| 模型 | 类型 | 输入 | 输出 | 折扣 |
|---|---|---|---|---|
| claude-opus-4-7 | 文本 | ¥35.5 $5 | ¥177.5 $25 | 7.5 折 |
| claude-opus-4-6 | 文本 | ¥35.5 $5 | ¥177.5 $25 | 7.5 折 |
| claude-sonnet-4-6 | 文本 | ¥21.3 $3 | ¥106.5 $15 | 7.5 折 |
| claude-opus-4-5-20251101 | 文本 | ¥35.5 $5 | ¥177.5 $25 | 7.5 折 |
| claude-haiku-4-5-20251001 | 文本 | ¥7.1 $1 | ¥35.5 $5 | 7.5 折 |
| claude-haiku-4-5-20251001-thinking | 文本 | ¥7.1 $1 | ¥35.5 $5 | 7.5 折 |
| claude-3-7-sonnet-20250219-thinking | 文本 | ¥21.3 $3 | ¥106.5 $15 | 7.5 折 |
| claude-opus-4-1-20250805 | 文本 | ¥106.5 $15 | ¥532.5 $75 | 7.5 折 |
| claude-3-7-sonnet-20250219 | 文本 | ¥21.3 $3 | ¥106.5 $15 | 7.5 折 |
| claude-opus-4-20250514 | 文本 | ¥106.5 $15 | ¥532.5 $75 | 7.5 折 |
| claude-sonnet-4-20250514-thinking | 文本 | ¥21.3 $3 | ¥106.5 $15 | 7.5 折 |
| claude-sonnet-4-5-20250929-thinking | 文本 | ¥21.3 $3 | ¥106.5 $15 | 7.5 折 |
| claude-3-haiku-20240307 | 文本 | ¥1.78 $0.25 | ¥8.88 $1.25 | 7.5 折 |
| claude-sonnet-4-5-20250929 | 文本 | ¥21.3 $3 | ¥106.5 $15 | 7.5 折 |
| claude-opus-4-1-20250805-thinking | 文本 | ¥106.5 $15 | ¥532.5 $75 | 7.5 折 |
Claude
15 个模型 7.5 折
-
claude-opus-4-7文本 in ¥35.5 $5 out ¥177.5 $25 -
claude-opus-4-6文本 in ¥35.5 $5 out ¥177.5 $25 -
claude-sonnet-4-6文本 in ¥21.3 $3 out ¥106.5 $15 -
claude-opus-4-5-20251101文本 in ¥35.5 $5 out ¥177.5 $25 -
claude-haiku-4-5-20251001文本 in ¥7.1 $1 out ¥35.5 $5 -
claude-haiku-4-5-20251001-thinking文本 in ¥7.1 $1 out ¥35.5 $5 -
claude-3-7-sonnet-20250219-thinking文本 in ¥21.3 $3 out ¥106.5 $15 -
claude-opus-4-1-20250805文本 in ¥106.5 $15 out ¥532.5 $75 -
claude-3-7-sonnet-20250219文本 in ¥21.3 $3 out ¥106.5 $15 -
claude-opus-4-20250514文本 in ¥106.5 $15 out ¥532.5 $75 -
claude-sonnet-4-20250514-thinking文本 in ¥21.3 $3 out ¥106.5 $15 -
claude-sonnet-4-5-20250929-thinking文本 in ¥21.3 $3 out ¥106.5 $15 -
claude-3-haiku-20240307文本 in ¥1.78 $0.25 out ¥8.88 $1.25 -
claude-sonnet-4-5-20250929文本 in ¥21.3 $3 out ¥106.5 $15 -
claude-opus-4-1-20250805-thinking文本 in ¥106.5 $15 out ¥532.5 $75
Gemini
13 个模型 7.5 折| 模型 | 类型 | 输入 | 输出 | 折扣 |
|---|---|---|---|---|
| gemini-3.1-flash-image-preview | 文本 | ¥3.55 $0.5 | ¥21.3 $3 | 7.5 折 |
| 图片 | — — | ¥426 $60 | 7.5 折 | |
| gemini-3.1-pro-preview | 文本 · ≤20w Tokens | ¥14.2 $2 | ¥85.2 $12 | 7.5 折 |
| 文本 · >20w Tokens | ¥28.4 $4 | ¥127.8 $18 | 7.5 折 | |
| gemini-3-flash-preview | 文本 | ¥3.55 $0.5 | ¥21.3 $3 | 7.5 折 |
| gemini-3-pro-image-preview | 文本 | ¥14.2 $2 | ¥85.2 $12 | 7.5 折 |
| 图片 | — — | ¥852 $120 | 7.5 折 | |
| gemini-2.5-flash | 文本 | ¥2.13 $0.3 | ¥17.75 $2.5 | 7.5 折 |
| gemini-2.5-flash-preview-09-2025 | 文本 | ¥2.13 $0.3 | ¥17.75 $2.5 | 7.5 折 |
| gemini-3-pro-preview | 文本 · ≤20w Tokens | ¥14.2 $2 | ¥85.2 $12 | 7.5 折 |
| 文本 · >20w Tokens | ¥28.4 $4 | ¥127.8 $18 | 7.5 折 | |
| gemini-2.0-flash | 文本 | ¥0.71 $0.1 | ¥2.84 $0.4 | 7.5 折 |
| gemini-2.5-flash-lite | 文本 | ¥0.71 $0.1 | ¥2.84 $0.4 | 7.5 折 |
| gemini-2.5-flash-image | 图片 | ¥2.13 $0.3 | ¥213 $30 | 7.5 折 |
| gemini-2.5-pro | 文本 · ≤20w Tokens | ¥8.88 $1.25 | ¥71 $10 | 7.5 折 |
| 文本 · >20w Tokens | ¥17.75 $2.5 | ¥106.5 $15 | 7.5 折 | |
| gemini-2.5-flash-lite-preview-09-2025 | 文本 | ¥0.71 $0.1 | ¥2.84 $0.4 | 7.5 折 |
| gemini-2.5-flash-image-preview | 图片 | ¥2.13 $0.3 | ¥213 $30 | 7.5 折 |
Gemini
13 个模型 7.5 折
-
gemini-3.1-flash-image-preview文本 in ¥3.55 $0.5 out ¥21.3 $3图片 in — — out ¥426 $60 -
gemini-3.1-pro-preview文本 · ≤20w Tokens in ¥14.2 $2 out ¥85.2 $12文本 · >20w Tokens in ¥28.4 $4 out ¥127.8 $18 -
gemini-3-flash-preview文本 in ¥3.55 $0.5 out ¥21.3 $3 -
gemini-3-pro-image-preview文本 in ¥14.2 $2 out ¥85.2 $12图片 in — — out ¥852 $120 -
gemini-2.5-flash文本 in ¥2.13 $0.3 out ¥17.75 $2.5 -
gemini-2.5-flash-preview-09-2025文本 in ¥2.13 $0.3 out ¥17.75 $2.5 -
gemini-3-pro-preview文本 · ≤20w Tokens in ¥14.2 $2 out ¥85.2 $12文本 · >20w Tokens in ¥28.4 $4 out ¥127.8 $18 -
gemini-2.0-flash文本 in ¥0.71 $0.1 out ¥2.84 $0.4 -
gemini-2.5-flash-lite文本 in ¥0.71 $0.1 out ¥2.84 $0.4 -
gemini-2.5-flash-image图片 in ¥2.13 $0.3 out ¥213 $30 -
gemini-2.5-pro文本 · ≤20w Tokens in ¥8.88 $1.25 out ¥71 $10文本 · >20w Tokens in ¥17.75 $2.5 out ¥106.5 $15 -
gemini-2.5-flash-lite-preview-09-2025文本 in ¥0.71 $0.1 out ¥2.84 $0.4 -
gemini-2.5-flash-image-preview图片 in ¥2.13 $0.3 out ¥213 $30
OpenAI
15 个模型 5.5 折| 模型 | 类型 | 输入 | 输出 | 折扣 |
|---|---|---|---|---|
| gpt-5.5-pro | 文本 | ¥213 $30 | ¥1278 $180 | 5.5 折 |
| gpt-5.5 | 文本 | ¥35.5 $5 | ¥213 $30 | 5.5 折 |
| gpt-5.4-pro | 文本 | ¥213 $30 | ¥1278 $180 | 5.5 折 |
| gpt-5.4 | 文本 | ¥17.75 $2.5 | ¥106.5 $15 | 5.5 折 |
| gpt-5.2 | 文本 | ¥12.43 $1.75 | ¥99.4 $14 | 5.5 折 |
| gpt-5-pro | 文本 | ¥106.5 $15 | ¥852 $120 | 5.5 折 |
| gpt-5.1 | 文本 | ¥8.88 $1.25 | ¥71 $10 | 5.5 折 |
| gpt-5 | 文本 | ¥8.88 $1.25 | ¥71 $10 | 5.5 折 |
| gpt-5-mini | 文本 | ¥1.77 $0.25 | ¥14.2 $2 | 5.5 折 |
| gpt-5-nano | 文本 | ¥0.355 $0.05 | ¥2.84 $0.4 | 5.5 折 |
| gpt-4.1-mini | 文本 | ¥2.84 $0.4 | ¥11.36 $1.6 | 5.5 折 |
| gpt-4o-2024-08-06 | 文本 | ¥17.75 $2.5 | ¥71 $10 | 5.5 折 |
| gpt-4.1-2025-04-14 | 文本 | ¥14.2 $2 | ¥56.8 $8 | 5.5 折 |
| gpt-4.1-nano | 文本 | ¥0.71 $0.1 | ¥2.84 $0.4 | 5.5 折 |
| gpt-4o-mini | 文本 | ¥2.84 $0.4 | ¥10.65 $1.5 | 5.5 折 |
OpenAI
15 个模型 5.5 折
-
gpt-5.5-pro文本 in ¥213 $30 out ¥1278 $180 -
gpt-5.5文本 in ¥35.5 $5 out ¥213 $30 -
gpt-5.4-pro文本 in ¥213 $30 out ¥1278 $180 -
gpt-5.4文本 in ¥17.75 $2.5 out ¥106.5 $15 -
gpt-5.2文本 in ¥12.43 $1.75 out ¥99.4 $14 -
gpt-5-pro文本 in ¥106.5 $15 out ¥852 $120 -
gpt-5.1文本 in ¥8.88 $1.25 out ¥71 $10 -
gpt-5文本 in ¥8.88 $1.25 out ¥71 $10 -
gpt-5-mini文本 in ¥1.77 $0.25 out ¥14.2 $2 -
gpt-5-nano文本 in ¥0.355 $0.05 out ¥2.84 $0.4 -
gpt-4.1-mini文本 in ¥2.84 $0.4 out ¥11.36 $1.6 -
gpt-4o-2024-08-06文本 in ¥17.75 $2.5 out ¥71 $10 -
gpt-4.1-2025-04-14文本 in ¥14.2 $2 out ¥56.8 $8 -
gpt-4.1-nano文本 in ¥0.71 $0.1 out ¥2.84 $0.4 -
gpt-4o-mini文本 in ¥2.84 $0.4 out ¥10.65 $1.5
价格随上游官方调整,请以充值时控制台公示为准。
即插即用
改一行 baseURL · 即接入
兼容 OpenAI / Claude / Gemini 全部 SDK 与 REST 接口。
from openai import OpenAI
client = OpenAI(
base_url="https://api.hivellm.io/v1", # ← only line that changes
api_key="hivellm-xxxxx",
)
resp = client.chat.completions.create(
model="gpt-4o", # or any of 100+ models
messages=[{"role": "user", "content": "hi"}],
)
print(resp.choices[0].message.content)