微信扫码
添加专属顾问
我要投稿
用过GPT-o1的都知道,o1的能力要明显强于GPT4,原因是o1有拟人化的思考模式,能把一个复杂问题拆解成小问题,让整个的推理任务更加严谨。
去年阿里还经常被网友喷,因为在Github上挂了很多不开源的DEMO。
士别三日当刮目相待。
要说今年阿里是真的猛,开源了巨多AI项目。
Qwen已经是在很多开源的AI项目里被经常“标配”的大模型了。
阿里这几天又开源了Marco-o1,也算是对GPT-o1的开源实现吧。
Marco-o1的论文里也讲了,是受了o1的启发。
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)
项目简介
Marco-o1 是由阿里巴巴 MarcoPolo 团队开发的大型推理模型,通过复杂的实际问题解决任务优化人工智能的推理能力。Marco-o1利用链式思考(CoT)微调、蒙特卡罗树搜索(MCTS)和反思机制,提高了问题解决的精确度和广度。Marco-o1应用于数学、物理和编程等领域,并且致力于开放式解决方案,特别是在难以量化奖励的领域内具有广泛的适用性和优越的性能。
开放式解决方案,实际就是针对没有标准答案的问题来做出更好的回答。
DEMO
这是一个测试大模型经典的“草莓”问题,strawberry中有多少个“r”。
答案是3没问题,但粉色框里的推理过程中可以看到,最后一个字母“y”被忽略掉了,还是有进步空间的。
Marco-o1在翻译方面有非常强的能力。
下面这个case是对“这双鞋有踩屎感”的翻译。
对于“踩屎感”的翻译,说实话没有很惊艳,因为这个词不管是通过AI搜索也好,还是通过后期训练学习也好也能很好的理解这个词。
下面这两段翻译,就能对比出来了。Marco-o1的翻译更能准确地传达原文的意思和情感,也更加地道。
技术特点
1、链式思考微调(CoT):模型通过链式思考来提升问题解决的逻辑性和深度,能够模拟人类解决复杂问题的思维过程。
2、蒙特卡罗树搜索(MCTS):采用蒙特卡罗树搜索技术来探索最优解答路径,增强模型在多步推理任务中的表现。
3、反思机制:通过自我反思机制,模型能够评估和修正其行动策略,提高决策的准确性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-10
从抵触AI到AI破局,我把Coze、n8n、Dify等5个主流智能体平台扒了个底朝天
2025-09-09
为 ONLYOFFICE AI 智能体开发自定义函数:实践指南&夺奖攻略!
2025-09-09
开源智能体开发框架全面对比分析
2025-09-09
Dify Pre-release版本来了,Dify2.0时代不远了,看看有哪些进步?
2025-09-09
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
2025-09-08
微信公众号“内容孤岛”终结者:免费开源工具,批量下载+完美还原!
2025-09-08
Claude不让用,有哪些国产模型能迎头赶上?
2025-09-08
前豆包大模型市场负责人创业,GEO服务商「PureblueAI清蓝」获千万级种子轮融资 丨涌现新项目
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-09-07
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13
2025-08-11
2025-08-11