微信扫码
添加专属顾问
我要投稿
经过数月的努力,阿里云今天发布了Qwen2,包括:
5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;
在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;
多个评测基准上的领先表现;
代码和数学能力显著提升;
增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。
目前,Qwen2已在Hugging Face和ModelScope上同步开源。以下是核心信息:
//
3.Qwen2的下一步是什么?
Qwen团队表示,还在训练更大的模型,继续探索模型及数据的Scaling Law。此外,还将把Qwen2扩展成多模态模型,融入视觉及语音的理解。在不久的将来,还会继续开源新模型。
- end -
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-06
从“搜索”到“行动”:AI 智能体正在重塑互联网
2025-11-06
如何为 AI 智能体定价?
2025-11-06
117倍效率提升:解密LightMem如何重塑LLM的记忆能力
2025-11-06
Gemini 重磅更新!Deep Research 可以读你的邮件、网盘、甚至聊天记录了
2025-11-06
从深度研究产品出发,全面理解智能体的关键技术概念
2025-11-06
ElevenLabs 创业方法论:公司拆成20个小团队,6个月没 PMF 原地解散
2025-11-05
Claude 的新"技能"功能,Claude Skills
2025-11-05
一文读懂Agentic AI 与 AI Agent的核心区别
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-17
2025-08-19
2025-09-29
2025-08-20