免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


刚刚,OpenAI开源了两个大模型~

发布日期:2025-11-02 11:31:34 浏览次数: 1568
作者:PaperAgent

微信搜一搜,关注“PaperAgent”

推荐语

OpenAI重磅开源两大安全推理模型,专为内容过滤与安全任务优化,助力开发者轻松构建安全应用。

核心内容:
1. GPT-OSS-Safeguard系列模型的核心功能与参数规格
2. 模型在安全推理、策略解读等场景的独特优势
3. 宽松的Apache 2.0许可证带来的商业应用便利

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


OpenAI开源的GPT-OSS-Safeguard-120B 和 GPT-OSS-Safeguard-20B 是基于 GPT-OSS 构建的安全推理模型。

使用这些模型,您可以根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务。这些模型主要用于安全用例。对于其他应用,我们建议使用 GPT-OSS 模型。
Flow diagram titled ‘Policy-based reasoning with gpt-oss-safeguard.’ Developer-provided policies and user-provided content feed into GPT-OSS-Safeguard. The model produces a chain-of-thought and then a policy decision, with a loop labeled ‘policy iteration’ feeding back to refine policies. A legend indicates developer input, user input, and model output.

GPT-OSS-Safeguard-20B(210 亿参数,其中 36 亿为活跃参数) 可以适配具有 16GB 显存的 GPU。如果您需要更大的模型,可以查看 GPT-OSS-Safeguard-120B(1170 亿参数,其中 51 亿为活跃参数)

亮点:

  • 安全推理训练: 专门针对安全推理进行训练和调整,以满足诸如 LLM 输入输出过滤、在线内容标记以及信任与安全用例的离线标记等使用场景。

  • 自带策略: 能够解读您书写的策略,从而在不同产品和使用场景中实现通用化,且几乎无需工程干预。

  • 推理决策,而不仅仅是分数: 您可以完全访问模型的推理过程,这有助于更轻松地调试并增强对策略决策的信任。请注意,原始 CoT(链式推理)是为开发人员和安全从业者设计的,不建议将其暴露给普通用户或用于安全上下文之外的用例。

  • 可配置的推理强度: 根据您的具体使用场景和延迟需求,轻松调整推理强度(低、中、高)。

  • 宽松的 Apache 2.0 许可证: 自由构建,无需担心版权共享限制或专利风险——非常适合实验、定制以及商业部署。

https://hf-mirror.com/openai/gpt-oss-safeguard-20b

推荐阅读

    •    •  Agent" data-itemshowtype="0" linktype="text" data-linktype="2">写论文烦恼无了,试试我用智谱开源的GLM-4.5做了一个科研助手Agent


    欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询