微信扫码
添加专属顾问
我要投稿
今天,我们发布了全链路领域增强大模型Baichuan4-Finance。
Baichuan4-Finance在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。
在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首,金融专业能力和场景应用能力大幅领先GPT-4o。
Baichuan4-Finance API现已在百川智能官网正式上线,感兴趣的朋友可以随时移步官网了解并申请体验。
网址:https://platform.baichuan-ai.com/finPage
整体准确率领先GPT-4o近20%,登顶多个权威金融评测
为了让大家更好地了解Baichuan4-Finance的能力,我们在多个权威金融评测基准上对其进行了评测。
FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中国人民大学财政金融学院12月17日发布的金融评测体系(github地址:https://github.com/FLAME-ruc/FLAME/tree/main)。
作为国内顶尖高校背书的金融领域最新的评测体系,FLAME兼顾专业性和实用性,由两个方向的评测基准组成,分别是:
FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。
GPT-4o大家非常熟悉,是金融领域公认的综合实力最强的通用模型之一;而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。
目前百川智能已经服务了数千家客户, 包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-23
Harness Monitor:当多个 Agent 同时写代码时,如何看住质量
2026-05-23
从 Appshots 到 Goal Mode:Codex 正在变成工作流 Agent
2026-05-23
2小时烧掉9亿token后,我发现了OpenAI和Anthropic在/goal上的本质区别
2026-05-23
我在一天内完成10场用户访谈,领导大受震撼
2026-05-23
Codex 的 computer use 功能,为什么这么好用?
2026-05-22
我让3个AI吵了一整天架,它们把PRD写完了
2026-05-22
Cursor 把内部代码审查工具放出来了,AI 写代码之后,质量风险变了
2026-05-22
Codex 又又又更新了,这次能拍图带上下文,/goal 也正式上线了
2026-04-15
2026-04-07
2026-03-31
2026-03-13
2026-03-17
2026-04-07
2026-03-17
2026-03-21
2026-04-24
2026-03-06
2026-05-23
2026-05-21
2026-05-19
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07