这家小公司的700 亿参数模型竟然比Open o1还强？

发布日期：2024-11-13 18:12:29 浏览次数： 3566

作者：AI小岛

微信搜一搜，关注“AI小岛”

你敢信？一家小型初创公司竟然凭借 700 亿参数的模型，直接在部分测试中超过了 Open o1，妥妥地在 AI 江湖里“秀”了一把！

来，一起看看这个小公司是怎么“以小博大”，在巨头环伺的领域里逆风翻盘的！

谁是这位深藏不露的高手？

这家初创公司名叫 Nous Research（诺斯研究院），虽然规模不大，但在开源社区早就小有名气。

2023 年到 2024 年期间，他们发布的开源微调模型可以说是"一鸣惊人"，在圈内收获了不少真金白银的口碑。

这次他们又整出了个大活 —— Forge Reasoning Engine（锻造推理引擎）。

那么，Forge 引擎有何“神通”？

Nous Research 并没有靠堆硬件、加参数，而是聪明地给 Hermes 70B 装上了“技术外挂”，在推理过程中让 AI 动脑“思考”。

具体来说，Forge 引擎的秘密武器有三大件：

1. 蒙特卡洛树搜索 (Monte Carlo Tree Search)

这种算法一般用于下棋和游戏AI，能帮助AI在复杂问题中寻找最佳路径。就是下围棋那位 AlphaGo 用的绝招！

2. 链式代码生成 (Chain of Code)

类似于代码执行链条，让AI能够像人类思考过程一样逐步推理，逐步构建答案。

3. 混合智能体 (Mixture of Agents)

相当于在AI大脑里分配多个“角色”，不同智能体互相协作，从而输出更复杂、更有深度的回答。

这三项技术组合在一起，使得Hermes 70B能够在推理时“更走心”，以极为复杂的思维结构解决问题，让小模型也能达到大模型的效果。

甚至在美国数学邀请赛考试中赢过了 o1！要知道这可是数学界的"高考"啊！

Forge的“推理”是如何运作的？

Forge的核心亮点在于其推理过程中的时间扩展（inference time scaling）。

通常模型的计算资源越多，推理速度越快，但Forge引擎让推理时间可调，通过延长推理时间提升Hermes 70B的理解和分析能力。

即使参数规模不及OpenAI的o1，Forge也能通过“花时间思考”来拉近与大模型的差距。

尤其是对于GPU资源有限的小公司或个人开发者，Forge简直是救星，不必苦恼于模型的巨大算力需求，用更多推理时间就能达到大模型的部分效果。

更神奇的还在后面

Forge 的另一大亮点在于它的通用性，不仅适用于 Hermes 70B，还可以配合不同模型使用。

任何公司都可以用 Forge 给自家模型升级推理能力，相当于让“千元机”也能跑出“旗舰机”水平。

低算力机器只要愿意多“思考”一下，也能接近大模型的效果。

这对资源不足的小公司来说，简直是“平权运动”啊！

目前仅开放给小范围测试用户

目前，Forge Reasoning Engine仍处于封闭测试阶段，仅对小范围的开发者和社区成员开放API使用权限。

Nous正在通过这波测试收集用户反馈，以进一步优化引擎，让其能够在各类场景下表现更出色。

如果你对该项目感兴趣，可以在Nous Research官网申请测试资格。

700亿参数模型VS超大模型：一场理性与资源的对抗

Nous的小规模团队用700亿参数挑战业界巨头，不仅是模型设计的胜利，更是思维方式的突破。

这无疑是对那些 GPU 资源不多的开发者的一种启发——AI模型的规模不再决定一切，只要推理结构足够精妙，哪怕小型模型也能在复杂推理任务中一展身手。

记住：在 AI 的世界里，除了拼爹拼钱以外，还可以拼智慧！

申请内测地址：nousresearch.typeform.com/FORGEAPI?typeform-source=forge.nousresearch.com

来源：nousresearch.com/introducing-the-forge-reasoning-api-beta-and-nous-chat-an-evolution-in-llm-inference

- End -

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-04

ThinkParse 1.1.0 开源发布：把文档解析，做成可扩展的企业级服务

2026-07-04

Agent 工程终于有脚手架了， Google开源一个开发agent的工具

2026-07-03

用云新范式：Qoder Cloud Agents × Alibaba Cloud Skills

2026-07-03

Ornith-1.0 发布：新一代 Agentic Coding 之王，MIT 开源

2026-07-02

Meta把内部设计系统开源了，支撑内部13000+应用，专为Agent调优

2026-07-02

别再把 AI 当搜索引擎了，这 20 个操作让它替你干活

2026-07-02

ollama v0.31.1发布：Apple Silicon上Gemma 4提速近90%，默认开启无感升级

2026-07-01

在 OpenCode 中接入本地模型：Ollama 部署与配置完全指南

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-22

Claude 的金融 Skills 开源了

2026-05-10

Ollama 换引擎，苹果 M5 封神了

2026-05-06

亲测有效！Codex桌面版免费接入DeepSeek V4

2026-05-31

Qwen3.7来了，全球排名第13，国内第一

2026-05-20

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Kimi K2.6 发布并开源，全面精进代码和 Agent 集群能力

2026-04-21

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw