微信扫码
添加专属顾问
我要投稿
OpenRouter快捷方式:优化成本和速度,同时增强AI的搜索能力。 核心内容: 1. :nitro快捷方式,按吞吐量排序选择最快提供商 2. :floor快捷方式,按价格排序选择最低成本提供商 3. :online快捷方式,为模型集成Web搜索能力
OpenRouter 提供了几个很实用的快捷方式(Shortcuts),想和大家分享一下。
它们可以附加在模型名称后面,实现不同的功能:
:nitro - 按吞吐量排序(优先选择速度最快的提供商):floor - 按最低价格排序(优先选择价格最低的提供商):online - 为模型提供 Web 搜索能力像这样:
// 按吞吐量排序(优先选择速度最快的提供商)
{
"model": "DeepSeek/deepseek-r1:nitro"
}
// 按最低价格排序(优先选择价格最低的提供商)
{
"model": "deepseek/deepseek-r1:floor"
}
// 为模型提供 Web 搜索能力
{
"model": "deepseek/deepseek-r1:online"
}
下面是它们的具体用法。
按吞吐量排序,优先选择速度最快的提供商。
{
"model": "deepseek/deepseek-r1:nitro",
"messages": [{ "role": "user", "content": "Hello" }]
}
等效于设置 provider.sort 为 throughput:
{
"model": "deepseek/deepseek-r1",
"messages": [{ "role": "user", "content": "Hello" }],
"provider": {
"sort": "throughput"
}
}
NOTE: 速度快的,价格可能稍贵一点,请查看官网模型提供商价格表。
按最低价格排序,优先选择价格最低的提供商。
{
"model": "deepseek/deepseek-r1:floor",
"messages": [{ "role": "user", "content": "Hello" }]
}
等效于设置 provider.sort 为 price:
{
"model": "deepseek/deepseek-r1",
"messages": [{ "role": "user", "content": "Hello" }],
"provider": {
"sort": "price"
}
}
大模型 + 联网搜索,可以说是当今 AI 应用的标配。
但写代码集成搜索 API,多少有点麻烦,尤其是对于普通用户来说。
所以 OpenRouter 提供了开箱即用的联网搜索解决方案。
只需要在模型名称后面加上 :online 即可。
OpenRouter 上的任何模型,都可以通过这种方式来集成 Web 搜索能力。
{
"model": "openai/gpt-4o:online",
"messages": [{ "role": "user", "content": "Hello" }]
}
等效于使用 web 插件:
{
"model": "openrouter/auto",
"plugins": [{ "id": "web" }]
}
OpenRouter 是使用 Exa (https://exa.ai) 提供联网搜索服务的。
⚠️ 值得一提的是:搜索需要额外收费。
Exa 进行搜索的,收费价格:4 美元/1000 条结果。GPT-4、GPT-4o、GPT-4 Omni,或 Perplexity 的 Sonar、SonarReasoning。具体收费详情,请参考:
https://openrouter.ai/docs/features/web-search#pricing
OpenRouter 针对用户常用需求场景,提供的这几个快捷方式,还是挺贴心的。
想用最快的服务提供商,加个 :nitro 就行。
想省钱?用 :floor。
想联网搜索?加个 :online 就搞定。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-14
我微调了一个LangChain专家模型,离Vibe Agent又近了一步
2025-12-11
左脚踩右脚:大模型的有趣且简单的微调方式“SHADOW-FT”
2025-12-11
大模型训练的高效内存解决方案:流水线感知的细粒度激活卸载,实现显存开销与吞吐性能的联合最优
2025-12-08
一杯咖啡成本搞定多模态微调:FC DevPod + Llama-Factory 极速实战
2025-12-04
OpenAI公开新的模型训练方法:或许能解决模型撒谎问题,已在GPT-5 thiking验证
2025-11-23
微调Rerank模型完整指南
2025-11-22
大模型微调全流程实战指南:基于IPO框架的深度解析与优化
2025-11-21
AI基础 | Qwen3 0.6B 微调实现轻量级意图识别
2025-10-12
2025-10-14
2025-10-21
2025-09-24
2025-09-20
2025-09-25
2025-11-05
2025-11-05
2025-11-21
2025-12-04