我要投稿

经过 4000 个分类处理，360 把国内这 12 个顶尖大模型擅长点都说清楚了。

发布日期：2024-08-19 05:39:06 浏览次数： 3857

作者：AI探索者知白

微信搜一搜，关注“AI探索者知白”

那这样一个混合模型有什么好处呢？当用户输入一个问题时，会进行意图识别，优先匹配擅长这块领域的大模型进行回答。

目前来看并没有一个大模型敢说自己在各个领域全方面领先，哪怕强如 GPT-4O 和 Claude3.5 也不行。而这样集各家之所长的“大模型”，可以说基本全方面达到最优，集成了国内大部分头部模型。

这其中最关键的问题就是：怎么知道哪个大模型在哪块领域擅长？于是 360 用自己过去积累的用户真实数据，找了几千万条问题，划分成 4000 个类别，对这些模型进行测试。

包括写作、代码生成、翻译、比一比、诗词赏析、知识问答等，决策出各个分类下的最强大模型。

最终它得出了各个模型擅长的领域如下：

360 智脑：擅长搜索、总结、思维导图，生成速度超快；
豆包：擅长创意写作、逻辑推理、知识问答等方向;
DeepSeek：对代码和图表具有强大的理解能力;
MiniMax：适合沉浸式角色扮演体验，引入超多虚拟角色;
通义千问：以电商、法律垂类的知识库和翻译能力著称;
Kimi：20W字超长记忆，擅长各种专业领域知识;
零一万物：办公首选，适合会议纪要、周报等场景;
文心一言：适合内容创作、对比判断类知识问答领域;
讯飞星火：逻辑推理、翻译能力突出，擅长教育方向;
商量-商汤：擅长医疗、编程等专业的垂直方向;
智谱清言：擅长多模态场景，模型推理训练等；
百小应：通用医疗增强大模型，AI医疗向专家；

相当于普通人的测试结果来说，360 测量得出的结果肯定更加准确。

有一个场景，之前单问某个模型，回答一直很傻逼。就是让它生成一个笑话，看看单个模型回答的结果：

看看 Kimi、文心一言、通义千问生成的笑话，是真的不好笑啊，属实有点尬。

而通过混合模型生成的效果明显就好上不少，看生成结果里显示是调用的豆包模型。

这就是混合模型的强大，生成的结果起码在国内应该是最优的，而对于使用者来说可以将它只当做是单个模型使用。

当然如果你想自己指定某个模型回答也是可以的，在这个网页上你可以随意切换模型，不需要登录到各个模型的官网上。

现在体验比较不好的一点是：不支持文件上传。因为 CoE 混合模型本身不具备文件读取的能力，就无法识别要调用哪个模型，这个需要 360 进一步优化了。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-20

AI接管输入法

2025-12-20

平均每个月亏3亿！从智谱招股书，我看到了大模型竞争的残酷现实

2025-12-20

我们可能搞错了 AI 的方向：未来不属于生成式 AI

2025-12-19

谷歌发布Gemini 3 Flash，全球免费，打破速度与智能不可兼得悖论

2025-12-19

刚刚，OpenAI最强编程大模型发布！

2025-12-19

AI架构师的诞生：AI+传统DDD模式 = 实现开发效率提升75%

2025-12-19

Anthropic 指路，Letta 破局：Agent 下半场的关键词是 Skills

2025-12-19

突发｜ChatGPT 版应用商店正式上线

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

2025-09-30

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

2025-10-20

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

Sora 2带来3个颠覆性创新，这个行业或将被彻底重构

2025-10-02

从spec-kit到OpenSpec：规格驱动开发如何解决项目迭代痛点？

2025-10-18

大家都在问

Prompt是与LLM对话的唯一方式：如何给大模型装上能指挥“手脚”的脑子？

2025-12-16

200k Tokens 的上下文真的够用吗？

2025-12-15

巨头翻身！谷歌全新AI浏览器Disco问世，PC版灵光？

2025-12-14

2025年，企业级AI的主战场在哪里？

2025-12-12

GPT 5.2的长上下文厉害了，但是写文真的强吗？

2025-12-12

涌现观点｜AI 开发的"App Store 时刻"：为什么你应该停止构建 Agent？

2025-12-11

Human In the Loop竟然可以是个MCP?

2025-12-09

AI会消灭搜索吗？

2025-12-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： [email protected]

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部