微信扫码
添加专属顾问
我要投稿
经过数月的努力,阿里云今天发布了Qwen2,包括:
5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;
在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;
多个评测基准上的领先表现;
代码和数学能力显著提升;
增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。
目前,Qwen2已在Hugging Face和ModelScope上同步开源。以下是核心信息:
//
3.Qwen2的下一步是什么?
Qwen团队表示,还在训练更大的模型,继续探索模型及数据的Scaling Law。此外,还将把Qwen2扩展成多模态模型,融入视觉及语音的理解。在不久的将来,还会继续开源新模型。
- end -
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-28
Manus 产品立项初期会议纪要
2025-12-28
Google的王牌拓展功能!使用Gemini CLI 的上下文驱动开发
2025-12-28
AI圈发生9级地震:大神 Karpathy 的一条推文,戳破了所有人的幻想
2025-12-28
吴恩达:构建企业级AI Agent的最佳实践
2025-12-27
【附实战案例】claude skills 生成神器:Skill Seeker让AI变身全栈专家
2025-12-27
手把手教你创建Claude Skills 照着做就能跑
2025-12-27
Claude Skills实用大全
2025-12-27
GPT-6 明年 Q1 突袭?OpenAI 战略大转向:这不仅是模型战,更是“生存战”!
2025-10-26
2025-10-02
2025-09-29
2025-10-07
2025-09-30
2025-11-19
2025-10-20
2025-11-13
2025-10-18
2025-10-02
2025-12-25
2025-12-25
2025-12-25
2025-12-22
2025-12-16
2025-12-15
2025-12-14
2025-12-12