vistara.cn 已上架 200+ 国产模型 · 阿里百炼全量直连 · 官方价 8.5 折 立即体验
阿里百炼 驱动 · 官方价 8.5 折

一个 API,
接入所有国产大模型

统一接入阿里百炼 200+ 国产大模型——qwen / deepseek / kimi / glm / 百川 / yi / 豆包 / 阶跃 / minimax,涵盖文本、视觉、音频、推理、代码、Embedding、Rerank。 OpenAI 兼容协议,3 行代码即可切换。基于阿里百炼官方 8.5 折,人民币结算、可开发票、国内合规。

为什么选 Vistara

把所有国产大模型,变成一个 API

不用每家厂商单独申请、对接 SDK、对账充值。Vistara 帮你抹平差异,你只管写代码。

统一 OpenAI 协议

所有模型走 OpenAI Chat Completion 协议。一份代码切换全部国产模型,无需改业务逻辑。

阿里百炼直连

所有模型来源于阿里百炼官方,SLA 99.95%+,模型覆盖最全。新模型 day-0 同步上线。

官方价 8.5 折

所有模型基于阿里百炼官方价 8.5 折。原价划线、折后价透明,付费后即开通,可开发票对公。

省 15%

国内合规

服务器部署在国内,数据不出境。基于阿里云百炼合规体系,适合企业级商用,无境外 API 风险。

国产模型库

200+ 主流模型,3 秒切换

覆盖文本、视觉、音频、推理、代码、长文本、Embedding、Rerank。新模型 day-0 上架,无需追每家厂商发布会。

查看全部 200+ 模型
QW
NEWHOT

Qwen3-Max

阿里 · 旗舰
输入¥20¥17
输出¥60¥51
128K 上下文LLM
QW

Qwen-Plus

阿里 · 性价比
输入¥0.8¥0.68
输出¥2¥1.7
128K 上下文LLM
QW

Qwen-Turbo

阿里 · 极速
输入¥0.3¥0.255
输出¥0.6¥0.51
1M 上下文LLM
QW
HOT

Qwen-Long

阿里 · 长文本
输入¥0.5¥0.43
输出¥2¥1.7
10M 上下文长文本
VL

Qwen-VL-Max

阿里 · 视觉旗舰
输入¥3¥2.55
输出¥9¥7.65
32K 上下文视觉
CO

Qwen-Coder-Plus

阿里 · 代码专精
输入¥0.8¥0.68
输出¥2¥1.7
128K 上下文代码
QQ
NEW

QwQ-32B-Preview

阿里 · 推理
输入¥2¥1.7
输出¥6¥5.1
32K 上下文推理
DS
HOT

DeepSeek-R1

DeepSeek · 推理
输入¥4¥3.4
输出¥16¥13.6
64K 上下文推理
DS
NEW

DeepSeek-V3.2

DeepSeek · 旗舰
输入¥2¥1.7
输出¥8¥6.8
64K 上下文LLM
KM

Moonshot-V1-128K

月之暗面 · Kimi
输入¥60¥51
输出¥60¥51
128K 上下文长文本
KM

Moonshot-V1-32K

月之暗面 · Kimi
输入¥24¥20.4
输出¥24¥20.4
32K 上下文LLM
GL

GLM-4-Plus

智谱 · 旗舰
输入¥50¥42.5
输出¥50¥42.5
128K 上下文LLM
GL

GLM-4-Air

智谱 · 轻量
输入¥1¥0.85
输出¥1¥0.85
128K 上下文LLM
BC

Baichuan4

百川 · 旗舰
输入¥100¥85
输出¥100¥85
32K 上下文LLM
VL

Qwen-VL-Plus

阿里 · 视觉
输入¥1.5¥1.275
输出¥4.5¥3.825
128K 上下文视觉
DS

R1-Distill-Qwen-32B

DeepSeek · 蒸馏
输入¥1¥0.85
输出¥4¥3.4
32K 上下文推理
QW

Qwen2.5-72B

阿里 · 开源旗舰
输入¥4¥3.4
输出¥12¥10.2
128K 上下文LLM
YI

Yi-Large

零一万物 · 旗舰
输入¥20¥17
输出¥20¥17
32K 上下文LLM
DB

Doubao-Pro

字节 · 豆包
输入¥0.8¥0.68
输出¥2¥1.7
32K 上下文LLM
ST

Step-2

阶跃星辰 · 旗舰
输入¥38¥32.3
输出¥120¥102
16K 上下文LLM
GL
FREE

GLM-4-Flash

智谱 · 免费试用
输入¥0.1¥0
输出¥0.1¥0
128K 上下文LLM
GL
NEW

GLM-Z1

智谱 · 推理
输入¥4¥3.4
输出¥16¥13.6
32K 上下文推理
TE

Text-Embedding-V3

阿里 · 向量化
单价¥0.5¥0.425
类型向量化
8K TokenEmbedding
RR

GTE-Rerank

阿里 · 重排
单价¥0.4¥0.34
类型检索重排
4K TokenRerank
价格说明 所有价格 ¥/百万 token,基于阿里百炼官方价 8.5 折(参考 help.aliyun.com/zh/model-studio/model-pricing)。最终价以控制台为准。
实时排行榜

开发者都在用哪些模型

基于过去 7 天 vistara 调用数据,每小时刷新 · 数据为示例占位待真实统计

热门榜

按调用量
  1. 01
    Qwen3-Max
    阿里 · 旗舰
    42.8B
  2. 02
    DeepSeek-V3.2
    DeepSeek · 旗舰
    31.2B
  3. 03
    Qwen-Plus
    阿里 · 性价比
    28.5B
  4. 04
    DeepSeek-R1
    DeepSeek · 推理
    19.7B
  5. 05
    Doubao-Pro
    字节 · 豆包
    14.3B

速度榜

按平均延迟
  1. 01
    Qwen-Turbo
    阿里 · 极速
    183ms
  2. 02
    GLM-4-Flash
    智谱 · 免费
    209ms
  3. 03
    DeepSeek-V3.2
    DeepSeek · 旗舰
    256ms
  4. 04
    Doubao-Pro
    字节 · 豆包
    312ms
  5. 05
    Qwen-Plus
    阿里 · 性价比
    348ms

性价比榜

按 ¥/百万 token
  1. 01
    GLM-4-Flash
    智谱 · 免费
    ¥0
  2. 02
    Qwen-Turbo
    阿里 · 极速
    ¥0.255
  3. 03
    Qwen-Long
    阿里 · 长文本
    ¥0.43
  4. 04
    Doubao-Pro
    字节 · 豆包
    ¥0.68
  5. 05
    Qwen-Plus
    阿里 · 性价比
    ¥0.68
极简接入

3 行代码,接入所有模型

已经在用 OpenAI SDK?把 base_url 改成 Vistara,一行代码完成迁移。
所有阿里百炼模型,同一份代码全部跑通。

查看文档
from openai import OpenAI

client = OpenAI(
    api_key="vsk-xxx",                    # vistara key
    base_url="https://api.vistara.cn/v1"   # 改这一行
)

response = client.chat.completions.create(
    model="qwen3-max",                   # 任意百炼模型
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)
使用场景

开发者用 Vistara 做什么

从原型到生产,一站到位

客户案例

金融场景客户用 Vistara 优化推理成本

通过智能路由 + 模型组合策略,客户在保持回答质量的前提下,日均 200 万次调用的综合成本显著降低,故障切换零感知。

阅读完整案例
60%
月度推理成本下降
透明定价

三档套餐,适合不同规模

所有套餐基于阿里百炼官方价 8.5 折,无最低消费,可随时升级

个人开发者
¥0/ 月
注册即开,适合个人项目、原型验证、学习使用
  • 注册赠送 ¥10 体验额度
  • 200+ 模型全部可用
  • 百炼官方价 8.5 折
  • OpenAI 协议兼容
  • 每秒 60 RPM 限速
  • 邮件工单支持
企业
联系商务
适合大规模生产部署、私有化、定制化场景
  • 定制阶梯折扣 + 月结
  • SLA 99.95% + 优先 Pool
  • 专属架构师 + 技术对接
  • RPM 不限 + 弹性扩容
  • 专有云部署 / VPC 接入
  • 对公转账 + 增值税票

最新动态

立即开始接入

免费注册,赠送体验额度。35+ 国产模型即开即用,百炼官方价 8.5 折。

已切换