微信扫码
添加专属顾问
我要投稿
OpenAI首次开源大模型gpt-oss系列,两款轻量级MoE模型性能直逼o4-mini,专为智能Agent工作流优化。 核心内容: 1. gpt-oss-120B和gpt-oss-20B的核心技术特点与性能优势 2. 模型在编程、数学、医疗等关键任务中的评测表现 3. 国际站上线详情及开发者使用指南
硅基流动国际站已上线由 OpenAI 开源的两款轻量级 MoE 模型 gpt-oss-120B(117B 总参数,5.1B 激活参数)和 gpt-oss-20B(21B 总参数,3.6B 激活参数)。
这是 OpenAI 首次对外开源的大模型。两款模型专为智能 Agent 工作流设计,均具备强大的指令执行、工具调用、少样本函数调用、结构化输出及完整思维链(CoT)能力,支持根据任务灵活调整逻辑推理强度,实现性能、成本与延迟的最佳平衡。在多项评测中,gpt-oss-120B 表现与 OpenAI o4-mini 持平甚至超越,即使规模更小 gpt-oss-20B 仍达到或优于 o3-mini 水平。
国际站上的 gpt-oss 支持 131K 最大上下文长度。其中,gpt-oss-120B 的价格为输入 0.09 美元 / M Tokens,输出为 0.45 美元 / M Tokens;gpt-oss-20B 的价格为输入 0.04 美元 / M Tokens,输出为 0.18 美元 / M Tokens。
欢迎通过以下方式使用 gpt-oss,国际站新用户可自动获取 1 美元赠金体验。
在线体验
https://cloud.siliconflow.com/models
开发者 API 文档
https://docs.siliconflow.com/en/api-reference/completion/create-completion
gpt-oss 模型采用 OpenAI 最先进的预训练与后训练优化技术,借鉴了包括 o3 等模型的前沿方法,特别强调逻辑推理能力、效率以及在多样化部署环境中的实际可用性。
两款模型均为 Transformer 架构,采用 MoE 以减少处理输入所需的活跃参数量。这些模型交替使用密集注意力与局部带状稀疏注意力模式,类似于 GPT‑3。为提升推理与内存效率,模型还使用分组多查询注意力机制(组大小为 8),并采用旋转位置编码(RoPE)进行位置表征,原生支持长达 128K 的上下文长度。
这些模型采用了与 o4-mini 相似的后训练流程,包括监督微调阶段和高计算量的强化学习阶段。通过采用与专有推理模型相同的技术,这些模型在后训练后展现出卓越性能。
OpenAI 团队对 gpt-oss-120B 和 gpt-oss-20B 进行了系统评测,重点考察它们在编程、竞赛数学、医疗及智能体工具调用等关键任务上的表现,并将其与主流 OpenAI 推理模型(包括 o3、o3‑mini 和 o4-mini)做了深入比较。
结果显示,gpt-oss-120B 在竞赛编程(Codeforces)、通用问题解决(MMLU 和 HLE)以及工具调用(TauBench)等多项任务中均优于 OpenAI o3‑mini,在多个维度上实现了与 OpenAI o4-mini 持平甚至更优。特别是在健康查询(HealthBench)与竞赛数学(AIME 2024 和 2025)方面,其表现甚至超过了 o4-mini。尽管 gpt-oss-20B 规模较小,但在同样的测试中也实现了与 o3‑mini 持平甚至更优的成绩,尤其在竞赛数学和医疗应用方面表现不俗。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-29
如何评测 AI 智能体:试试字节开源的扣子罗盘
2025-08-29
HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
2025-08-28
美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力
2025-08-28
我摊牌了,PDF的终结者出现了!这个开源神器,让你的RAG项目吞吐能力暴增10倍!
2025-08-28
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
2025-08-28
1.9K Star 微软开源TTS王炸!90分钟超长语音合成,4人对话自然切换!
2025-08-27
初探:从0开始的AI-Agent开发踩坑实录
2025-08-27
ollama v0.11.7发布:深度集成DeepSeek-V3.1与Turbo云端推理模式解析
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12