微信扫码
添加专属顾问
我要投稿
据路透社报道,来自三个不同科学机构的六名中国研究人员,通过Meta所发布的开源模型Llama的早期版本,开发了名为“ChatBIT”的人工智能应用。
其中两位研究人员来自军事科学机构,研究人员使用Meta于2023年2月发布的Llama 2大型语言模型进行了微调,构建了一个聚焦军事的AI工具,旨在收集和处理情报,为作战决策提供准确可靠的信息。
1:学术研究的合理性
将研究成果以论文形式发表,彰显了科研的本质。这种做法不仅是对技术的探索,也是大模型在不同领域应用的一次良好尝试。开放的学术环境应该欢迎这样的创新,无论其出发点如何。
2:Meta的反应与政策
目前,Llama模型的权重是开源的,Meta在技术上无法限制其使用。但它从授权形式上设置了一些限制,比如要求拥有超过7亿用户的服务向其申请许可,并禁止将这些模型用于“军事、战争、核工业或间谍活动”等受美国国防出口管制的领域,但这在一定程度上展现了科技霸权。
既然选择了开源,就应该允许全球不同国家和领域的研究者进行探索,这才符合互联网的开放精神,难道只能美国才能研究?
3:Meta为何选择开源
开源背后必然有其动机,扎克伯格曾表示,Meta起步较晚,缺乏竞争优势,因此选择开放源代码,以从周围生态中获益。
这种策略显然有助于Meta的股票上涨,且带动了众多基于Llama的下游服务商建立生态,赚翻了!
4:大模型的真正开源
虽然Llama的权重是开源的,但训练方法和数据并未开放,因此这种开源形式实际上是“伪开源”。Meta仍然掌握着技术的核心和优势。在缺乏广泛生态利益或对下游行业的控制时,完全开源几乎是不可能的。
即使技术上可行,普通开发者也难以复刻这些超大规模模型,巨大的成本与潜在的版权问题都是障碍,Meta不可能将技术优势给予和他一样规模的公司。
OSI标准化组织定义了大语言模型开源标准OSAID,动机是好的也是单纯的,但估计根本不具备可实施性。
5:国内大模型的发展现状
通过上图可以推测,目前许多企业在大语言模型的应用上策略不明确,动机令人质疑。若继续以当前方式推进,大多数企业可能因资金不足而消亡。
未来,存活的大模型企业应具备以下特点:一是财力雄厚,二是技术积累深厚,三是领导者具备强烈的技术洞察力。例如,百度和科大讯飞在自然语言处理(NLP)领域已有一定基础,李彦宏在无人驾驶领域的持续探索也显示了对科技发展的渴望。
国内未来可能仅需2至3家大模型企业,盲目烧钱毫无意义。即使在利用开源技术的过程中,企业也应将大模型技术融入自身产品中,例如百度地图和百度文库的集成。通过不断打磨与实践,才可能实现真正的技术突破。
通义千问不得不提,在推特上经常看到很多国外的从业者对于它的评测,开源做的很不错,可见对于大模型发展来说,领导人的智慧很重要,他们可能看的更远。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-10
从抵触AI到AI破局,我把Coze、n8n、Dify等5个主流智能体平台扒了个底朝天
2025-09-09
为 ONLYOFFICE AI 智能体开发自定义函数:实践指南&夺奖攻略!
2025-09-09
开源智能体开发框架全面对比分析
2025-09-09
Dify Pre-release版本来了,Dify2.0时代不远了,看看有哪些进步?
2025-09-09
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
2025-09-08
微信公众号“内容孤岛”终结者:免费开源工具,批量下载+完美还原!
2025-09-08
Claude不让用,有哪些国产模型能迎头赶上?
2025-09-08
前豆包大模型市场负责人创业,GEO服务商「PureblueAI清蓝」获千万级种子轮融资 丨涌现新项目
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-09-07
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13
2025-08-11
2025-08-11