我要投稿

360智脑开源7B大模型，支持360k（50万字）长文本输入

发布日期：2024-06-02 12:45:00 浏览次数： 3496

作者：努力犯错玩AI

微信搜一搜，关注“努力犯错玩AI”

前言

360公司正式开源了自研的7B参数大模型"360智脑"系列，包括基础模型和支持4K、32K、360K三种不同长度上下文的聊天模型。其中，最长可支持360K（约50万字）的长文本输入，这在开源大模型中极为罕见。

360智脑7B系列模型不仅开源了模型权重，连同微调训练代码、推理部署代码等工具链一并开放给开发者使用，真正做到了"开箱即用"。

Huggingface模型下载：https://huggingface.co/qihoo360
AI快站模型免费加速下载：https://aifasthub.com/models/qihoo360

强大的性能表现

根据OpenCompass的综合评测，360智脑7B大模型在同等参数的模型中位居前三，在C-Eval、MMLU、HellaSwag、LAMBADA等多个单项能力测试中更是拔得头筹，展现出了卓越的中英文知识和推理理解能力。

即便面对"弱智吧"等恶意测试，360智脑7B大模型也能清晰、从容地应对，充分彰显了其强大的语言理解实力。

领先的长文本处理能力

在长文本处理能力方面，360智脑7B大模型在LongBench评测中取得了同等参数模型中的最高分。不仅如此，在中英文360K长文本理解测试中，其准确率也均超过了98%。

这得益于360团队在模型设计上的创新。他们摒弃了传统的滑动窗口attention、跳跃attention等有损压缩方法，转而采用了全新的超长文本无损压缩技术。这确保了模型在处理长文本时能最大限度地保留原始信息，从而实现高效的长文本理解。

这项突破性技术的应用，使得360智脑7B大模型成为目前开源领域中支持最长文本输入的模型，最长可达360K（约50万字），相当于可以在3秒内阅读完《三体》全书。

结论

总的来说，360公司开源360智脑7B大模型，不仅彰显了其技术实力，更代表了一种积极开放的姿态。这不仅促进了AI领域的技术进步，也为各行业带来了新的可能性，值得期待。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-20

没更新Antigravity的先别动，更新了的我先替你们哭一会

2026-05-20

刚发布的Antigravity 2.0：从开发到管理的一跃

2026-05-20

Qwen3.7-Max 重新定义 AI Agent 基座

2026-05-20

直击 Google I/O 2026 | 轰炸式发布 Agent，狙击 Claude Code，开战！

2026-05-20

谷歌一口气发了 20 多个产品，但只想讲一件事

2026-05-20

I/O 2026：欢迎来到智能体 Gemini 时代

2026-05-20

首个Gemini桌面端曝光，系统级Agent空降PC！

2026-05-20

一文看懂 Google I/O 2026：Gemini 3.5领衔谷歌打响智能体和全模态大战

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

OpenAI Codex CLI 完整使用指南

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

全球首个 AI 进化网络 EvoMap，给 Agent 装上 DNA

2026-02-20

大家都在问

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

为什么同一个模型，在 Claude Code/Codex CLI 里感觉像换了个脑子？

2026-05-07

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部