HiveLLM HiveLLM
AI 网关 · 智能调度

一个 API
调度 100+ 大模型

聚合 OpenAI、Claude、Gemini、DeepSeek、Qwen 等 40+ 上游服务商。改一行 baseURL 即接入,自动重试、配额管控、成本可视化,一站搞定。

兼容 OpenAI / Claude / Gemini SDK 99.9% 可用

50+

上游服务商

100+

可计费模型

50+

兼容 API 路由

99.9%

运行可用性

已接入

主流大模型 · 一处调度

OpenAIOpenAI
ClaudeClaude
GeminiGemini
DeepSeekDeepSeek
QwenQwen
DoubaoDoubao
MinimaxMiniMax
MoonshotAIMoonshot
MistralMistral
CohereCohere
GrokGrok
YiYi
ZhipuZhipu
MetaMeta
OpenAIOpenAI
ClaudeClaude
GeminiGemini
DeepSeekDeepSeek
QwenQwen
DoubaoDoubao
MinimaxMiniMax
MoonshotAIMoonshot
MistralMistral
CohereCohere
GrokGrok
YiYi
ZhipuZhipu
MetaMeta

核心特性

为生产级 AI 应用而生

01

智能路由 · 自动重试

基于权重的多渠道路由,单家失败自动切换;支持限速、降级与配额隔离,业务无感。

OpenAI Claude Gemini DeepSeek Qwen
02

透明计费

按 token 实时计费,缓存命中折扣自动识别,账单一行一目了然。

实时计费 token 计量 缓存折扣 多档识别
03

零迁移成本

OpenAI / Claude / Gemini SDK 直接复用,仅替换 baseURL 即接入。

baseURL: hivellm.io/v1
04

企业级安全

令牌分组、IP 白名单、模型黑白名单、审计日志全程留痕。

IP 白名单 令牌分组 审计日志 配额隔离

高并发

自动负载均衡,单实例 8000+ QPS。

可观测

Token / 请求 / 耗时 / 错误一图打通。

多租户

团队 / 项目 / 用户三级权限隔离。

可私有化

私有化部署、数据自主可控,不受任何供应商绑定。

透明价格

全模型 · 5.5 折起

所有大模型按 token 实时计费,各厂商对应折扣见下表,价格随上游官方同步调整。

5.5 折起

价格单位:¥ / 百万 tokens(含 USD 对照)

Claude

15 个模型 7.5 折
  • claude-opus-4-7
    文本 in ¥35.5 $5 out ¥177.5 $25
  • claude-opus-4-6
    文本 in ¥35.5 $5 out ¥177.5 $25
  • claude-sonnet-4-6
    文本 in ¥21.3 $3 out ¥106.5 $15
  • claude-opus-4-5-20251101
    文本 in ¥35.5 $5 out ¥177.5 $25
  • claude-haiku-4-5-20251001
    文本 in ¥7.1 $1 out ¥35.5 $5
  • claude-haiku-4-5-20251001-thinking
    文本 in ¥7.1 $1 out ¥35.5 $5
  • claude-3-7-sonnet-20250219-thinking
    文本 in ¥21.3 $3 out ¥106.5 $15
  • claude-opus-4-1-20250805
    文本 in ¥106.5 $15 out ¥532.5 $75
  • claude-3-7-sonnet-20250219
    文本 in ¥21.3 $3 out ¥106.5 $15
  • claude-opus-4-20250514
    文本 in ¥106.5 $15 out ¥532.5 $75
  • claude-sonnet-4-20250514-thinking
    文本 in ¥21.3 $3 out ¥106.5 $15
  • claude-sonnet-4-5-20250929-thinking
    文本 in ¥21.3 $3 out ¥106.5 $15
  • claude-3-haiku-20240307
    文本 in ¥1.78 $0.25 out ¥8.88 $1.25
  • claude-sonnet-4-5-20250929
    文本 in ¥21.3 $3 out ¥106.5 $15
  • claude-opus-4-1-20250805-thinking
    文本 in ¥106.5 $15 out ¥532.5 $75

Gemini

13 个模型 7.5 折
  • gemini-3.1-flash-image-preview
    文本 in ¥3.55 $0.5 out ¥21.3 $3
    图片 in out ¥426 $60
  • gemini-3.1-pro-preview
    文本 · ≤20w Tokens in ¥14.2 $2 out ¥85.2 $12
    文本 · >20w Tokens in ¥28.4 $4 out ¥127.8 $18
  • gemini-3-flash-preview
    文本 in ¥3.55 $0.5 out ¥21.3 $3
  • gemini-3-pro-image-preview
    文本 in ¥14.2 $2 out ¥85.2 $12
    图片 in out ¥852 $120
  • gemini-2.5-flash
    文本 in ¥2.13 $0.3 out ¥17.75 $2.5
  • gemini-2.5-flash-preview-09-2025
    文本 in ¥2.13 $0.3 out ¥17.75 $2.5
  • gemini-3-pro-preview
    文本 · ≤20w Tokens in ¥14.2 $2 out ¥85.2 $12
    文本 · >20w Tokens in ¥28.4 $4 out ¥127.8 $18
  • gemini-2.0-flash
    文本 in ¥0.71 $0.1 out ¥2.84 $0.4
  • gemini-2.5-flash-lite
    文本 in ¥0.71 $0.1 out ¥2.84 $0.4
  • gemini-2.5-flash-image
    图片 in ¥2.13 $0.3 out ¥213 $30
  • gemini-2.5-pro
    文本 · ≤20w Tokens in ¥8.88 $1.25 out ¥71 $10
    文本 · >20w Tokens in ¥17.75 $2.5 out ¥106.5 $15
  • gemini-2.5-flash-lite-preview-09-2025
    文本 in ¥0.71 $0.1 out ¥2.84 $0.4
  • gemini-2.5-flash-image-preview
    图片 in ¥2.13 $0.3 out ¥213 $30

OpenAI

15 个模型 5.5 折
  • gpt-5.5-pro
    文本 in ¥213 $30 out ¥1278 $180
  • gpt-5.5
    文本 in ¥35.5 $5 out ¥213 $30
  • gpt-5.4-pro
    文本 in ¥213 $30 out ¥1278 $180
  • gpt-5.4
    文本 in ¥17.75 $2.5 out ¥106.5 $15
  • gpt-5.2
    文本 in ¥12.43 $1.75 out ¥99.4 $14
  • gpt-5-pro
    文本 in ¥106.5 $15 out ¥852 $120
  • gpt-5.1
    文本 in ¥8.88 $1.25 out ¥71 $10
  • gpt-5
    文本 in ¥8.88 $1.25 out ¥71 $10
  • gpt-5-mini
    文本 in ¥1.77 $0.25 out ¥14.2 $2
  • gpt-5-nano
    文本 in ¥0.355 $0.05 out ¥2.84 $0.4
  • gpt-4.1-mini
    文本 in ¥2.84 $0.4 out ¥11.36 $1.6
  • gpt-4o-2024-08-06
    文本 in ¥17.75 $2.5 out ¥71 $10
  • gpt-4.1-2025-04-14
    文本 in ¥14.2 $2 out ¥56.8 $8
  • gpt-4.1-nano
    文本 in ¥0.71 $0.1 out ¥2.84 $0.4
  • gpt-4o-mini
    文本 in ¥2.84 $0.4 out ¥10.65 $1.5

价格随上游官方调整,请以充值时控制台公示为准。

即插即用

改一行 baseURL · 即接入

兼容 OpenAI / Claude / Gemini 全部 SDK 与 REST 接口。

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hivellm.io/v1",   # ← only line that changes
    api_key="hivellm-xxxxx",
)

resp = client.chat.completions.create(
    model="gpt-4o",                          # or any of 100+ models
    messages=[{"role": "user", "content": "hi"}],
)
print(resp.choices[0].message.content)