微信扫码
添加专属顾问
我要投稿
阿里开源QwQ-32B推理模型,以32.5B参数挑战千亿参数模型,实现智能与成本的双重突破。 核心内容: 1. QwQ-32B模型的参数效率革命:32.5B参数量对比671B参数量,降低成本同时保持性能 2. 核心架构创新与性能评测:在特定领域与顶级闭源模型抗衡,数学、编程、通用能力领先 3. 硬件适配与存储优化:FP8兼容架构,动态内存管理,更适合边缘计算部署
GPQA Diamond 评测
QwQ-32B得分 59.5%,显著落后于DeepSeek R1(71%),略逊于Gemini 2.0 Flash(62%)。
AIME 2024评测
QwQ-32B以 78% 的得分反超DeepSeek R1,仅次于一骑绝尘的o3-mini-high模型。
解读:在复杂学术推理(GPQA)上仍有差距,但在医学诊断推理(AIME)中表现亮眼,验证了阿里“轻量高效”的技术路线潜力。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-22
Notesnook:一款完全开源、以隐私为核心的笔记应用
2025-12-22
一文彻底看懂 Google 最新开源 A2UI 协议:如何让 AI Agent “说出UI” ?
2025-12-22
火线解析MiniMax招股书!全球领先大模型成本只有OpenAI 1%,果然拳怕少壮
2025-12-21
Benotes:一款功能强大、易于安装和使用的开源笔记与书签一体化应用
2025-12-21
告别每月 AI 订阅费!这款开源笔记内置 Ollama,让你的电脑变身第二大脑
2025-12-20
开口跪!这款开源TTS让AI说话带“情绪”,还能多语言克隆!
2025-12-20
ollama v0.13.5 发布详解:新模型接入、引擎升级与工具能力增强
2025-12-19
小米大模型Mimo-V2-Flash本地部署
2025-11-19
2025-10-20
2025-10-27
2025-10-27
2025-10-03
2025-09-29
2025-11-17
2025-10-29
2025-09-29
2025-11-07
2025-12-22
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29