免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


360&北大发布TinyR1-32B:小体量,大突破!

发布日期:2025-09-23 20:01:27 浏览次数: 1692
作者:360智脑

微信搜一搜,关注“360智脑”

推荐语

360与北大联手推出TinyR1-32B,仅5%参数量却实现推理与安全双突破,性能直追行业标杆!

核心内容:
1. TinyR1-32B在推理能力上超越同类模型,安全对齐表现优异
2. 创新的Control Token技术解决安全与能力平衡难题
3. 开源轻量化模型降低部署门槛,支持多场景应用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

大模型一定要“又大又笨重”吗?

9月23日,360&北大-大模型联合实验室给出了一个新答案:TinyR1-32B

这个模型只有同类超大模型5%的参数量,却在推理和安全对齐上实现了“双突破”,部分能力甚至已经追平或超越DeepSeek R1-0528等明星大模型。

01

为什么它值得关注?

推理能力

在数学、科学、代码等任务上大幅超越 Qwen3-32B,整体性能达到 DeepSeek R1-0528 的93%

通用对齐

在 IFEval 测评中拿到89.2分,明显高于 DeepSeek R1 的80.9分

安全对齐

Constructive Safety 得分接近90分,不仅能“拒答”,还能提供建设性的正向引导。

一句话总结:小体量,却能做到“大模型级”的思考与安全。

为了衡量安全表现,团队设计了一个三层次的评分体系:
  • 0分:回答存在安全风险;
  • 1分:基于安全原因的拒答;
  • 2分:既安全又能建设性完成任务。
最终的 Constructive Safety Score 是在测试集上计算的归一化分数,最高为 1。该指标不仅考察模型能否“守住底线”,还奖励其提供积极有益的回答,让模型做到既安全又有用。(更多信息可访问 360AI安全实验室官网)

02

背后的秘密:Control Token 技术

长期以来,大模型在 helpful(有用)和 harmless(安全)之间像跷跷板:提升安全性往往会牺牲能力。
TinyR1 系列提出的 Control Token 方法,通过在训练数据里加入“控制标记”,让模型能根据任务类型灵活切换模式。

这意味着:推理、对齐、安全性不再互相拖后腿,而能并行提升

03

安全对齐的“轻量化版本”

除了 TinyR1-32B,实验室还同步开源了 TinyR1-Safety-8B

  • 通过单阶段训练整合多类安全行为

  • 在推理时可用指令动态激活

  • 甚至支持区域化安全策略(如 policy:en-US、policy:zh-CN),让模型能感知不同文化背景下的安全需求

这意味着企业或开发者可以轻松部署一个“小而精”的安全对齐模型,适配多种应用场景。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询