微信扫码
添加专属顾问
我要投稿
蚂蚁·安诊儿医疗大模型开源登顶,树立AI医疗新标杆,展现专业性与安全性双优表现。 核心内容: 1. 蚂蚁·安诊儿医疗大模型的技术架构与训练流程 2. 在国内外权威医疗评测中的领先表现 3. 为AI医疗应用树立高效、专业、安全的新标准
近日,蚂蚁集团联合浙江省卫生健康委正式开源其自研的蚂蚁·安诊儿医疗大模型(AntAngelMed)。该模型基于蚂蚁百灵大模型的高效混合专家(MoE)架构,结合真实、全面的医疗数据深度训练而成,是迄今为止参数规模最大的开源医疗模型(100B 总参数)。
用户价值:领先的医学能力
AntAngelMed 已在 OpenAI 发起的 HealthBench 和国家人工智能应用中试基地(医疗)的 MedAIBench 等评测基准中表现出色,树立了开源 AI 医疗模型 “高效、专业、安全” 的新标杆。
在由 OpenAI 主导、全球 262 名医生参与构建的 HealthBench 评测中,AntAngelMed 在 HealthBench 上的评分达到开源模型第一,超过DeepSeek-R1、Qwen3、OpenAI GPT-OSS 等模型,并且在极具挑战性的 HealthBench-Hard 子集上展现出尤为显著的优势,充分证明了其在真实、复杂医疗环境中的可靠性与专业性。
在由国家人工智能应用中试基地(医疗)·浙江联合中国医学科学院北京协和医学院、中国信息通信研究院三方共建的权威测评体系 MedAIBench 中,AntAngelMed 同样展现出强大的综合专业性与安全性,在医疗知识问答、医疗伦理安全等多个核心维度表现突出。这种 “通用智能+医疗专长” 的全栈能力闭环,标志着开源 AI 医疗模型进入了“高效、专业、安全”三者兼顾的新阶段,为 AI 技术在医疗领域的应用树立了新的标杆。
对于面向中文医疗场景医疗大模型评测体系 MedBench(36 个自主评测集,覆盖约 70 万条样本),AntAngelMed 位列自测榜单第一,在医学知识问答、医学语言理解、医学语言生成、复杂医学推理、医疗安全与伦理五大核心维度也都表现出领先水平,体现出 AntAngelMed 医疗大模型的专业性、安全性与临床适用性。
技术解析:三阶段专业训练
AntAngelMed 卓越的医疗能力源于其专业、精细的三阶段训练流程。
首先,通过持续预训练对通用基座模型 Ling-flash-2.0-base 注入大规模、高质量的医学语料,构建了深厚的医疗知识底蕴;
随后,在监督微调阶段,通过多源异构的高质量指令数据,一方面强化了模型的通用核心思维链,另一方面针对医患问答、诊断推理等真实医疗场景进行深度适配;
最后,AntAngelMed 采用先进的 GRPO 强化学习算法,并通过双阶段强化学习路径对模型能力进一步优化提升:首先以“推理强化学习”锻造其逻辑推理的核心能力,再以“通用强化学习”打磨其同理心与安全边界意识,最终实现了医疗专业性与人文关怀的高度统一。
(专业三阶段训练流程)
高效架构、高速推理
作为蚂蚁在医疗 AI 领域的关键突破,AntAngelMed 大模型在模型架构设计、训练效率与推理性能上实现了技术引领。AntAngelMed 继承了百灵大模型 Ling-flash-2.0 的高效混合专家(MoE)架构,并在一系列核心设计上进行了全面优化,包括 1/32 激活比例、无辅助损失 + Sigmoid 路由策略、MTP 层及 Partial-RoPE 等。这些精细的改进使得模型相比同等规模的 Dense 架构实现了 7 倍的效率提升。换言之,AntAngelMed 仅需 6.1B 激活参数,即可媲美约 40B 稠密模型的性能,并在 H20 硬件上实现超过 200 tokens/s 的推理速度,展现了极致的性能与效率。
(Ling-flash-2.0 模型架构)
我们还专为 AntAngelMed 进行推理加速,采用 FP8 量化 + EAGLE3 优化,在 32 并发场景下,推理吞吐量较 FP8 显著提升:在 HumanEval 提升 71%,GSM8K 提升 45%,Math-500 提升高达 94%,实现了推理性能与模型稳定性的深度平衡。
使用体验:推理效果展示
蚂蚁·安诊儿医疗大模型不管是在您身体抱恙需要诊断的场景,还是在平时生活中的健康管理场景,都可以使用,为您的健康保驾护航,相关能力可通过模型调用在下游应用中快速上线。
症状/疾病诊治类
提问:为什么肝硬化切除部分肝脏的手术要做肝癌的检查,肝硬化肝腹水等于肝癌吗?做肝癌检查的目的是什么?
思考过程:
上下滑动查看更多
回答:
上下滑动查看更多
泛健康与生活方式类
提问:早起就喝水能缓解便秘吗?
思考过程:
上下滑动查看更多
回答:
上下滑动查看更多
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
Claude Code——智能路由与切换工具
2026-02-03
作为投资方,我们试了试Kimi K2.5
2026-02-03
暴涨11.7k Star!复刻Manus上下文工程的开源Skills,Claude code等多个平台即插即用
2026-02-03
ollama v0.15.4 更新:OpenClaw全面上线,优化集成流程与工具解析能力大升级!
2026-02-03
阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!
2026-02-02
一分钟部署OpenClaw+QQ,国内最爽的一键启动!
2026-02-02
这家字节系AI初创,推出首个开源Agent Skills Builder!对话Refly.AI李锦威:大多数Agent都停留在专业用户层面,没有做到真正的普惠
2026-02-02
OCR又出宠OpenDoc,速度超MinerU6倍
2025-11-19
2026-01-27
2025-12-22
2025-12-10
2025-11-17
2026-01-12
2025-11-07
2025-12-23
2026-01-29
2026-01-06
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24