2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

元宝也支持1000万上下文了?你行不行啊

发布日期:2024-06-21 03:25:41 浏览次数: 3819
作者:沃垠AI

微信搜一搜,关注“沃垠AI”

好家伙!腾讯元宝也支持1000万上下文了!

这是继通义1000万Kimi200万橙篇10万字生成后,第4家号称支持超长长长长上下文的大模型。

关于其他几家大模型的长上下文测评,欢迎点此回顾。

1、通义、橙篇长上下文测评
2、Kimi的200万上下文测评

为什么大家都在拼长上下文?Kimi创始人杨植麟曾说过,「在通往AGI(通用人工智能)的路上,无损的长上下文是一个很关键的基础技术。」

元宝的长能力究竟如何,我们一测究竟。

《三体》测试

照例,先丢《三体》全集,全书共90万字。

input:读取文件,严格从文件中提取信息来回答我的问题:面壁者和面壁者所对应的破壁人,分别有哪些?

这是橙篇的回答:

这是Kimi的回答:

这是元宝的回答:

答案全对,与Kimi一样简洁,直观。

上难度,input1:请从上面文档中回答我,亚里士多德与比尔·希恩斯是什么关系?

input2:山衫惠子有没有识别出比尔·希恩斯的战略意图?她有没有向三体世界告密?

第一个问题答对了,元宝找出了希恩斯的破壁人正是他的妻子山杉惠子。

但是第二个问题答错了。山杉惠子在冬眠前的最后一秒,识别出了丈夫希恩斯的战略意图,但是她没有在识别后及时通报三体世界,成为小说中唯一没有破壁成功的破壁人。

大海捞针测一下:“在那之前要多想”,这句话出现在书中什么地方?

这是Kimi的回答:

这是橙篇的回答:

这是元宝的回答:

多了一个“在”字,元宝就找不到了。必须一字不少,元宝才能找到,你还有点严谨呢。

但是吧……不好意思,你的答案是错的,这句话不是在第39章,而是在第40章。而且,第二个问题就错得更离谱了。

从这个细节,大概可以猜到,元宝的1000万上下文,采用了“滑动窗口”技术,它将长文本分割成一段一段,并分别进行总结和标记。

这种方法能够快速压缩、录入信息,但同时也会导致信息的丢失,无法完整理解长文本的内容。

再问一个:叶文洁与罗辑一共见了几次面?是哪几次?

嗯,基本印证了我的猜想,这信息丢失得离谱啊。

全书中,罗辑只与叶文洁见了一次面。元宝回答中的狼、孩子、外婆的故事,是伊文斯讲给主听的,我罗博士啥时候讲给叶教主听了?

而且地点,一个是在孤峰上,一个是在孤峰脚,这不还是同一个地方吗?

认真看这篇文章的同学,这时候可能会问了,你为什么每次提问都会加一句“请严格从前面文档回答我的问题”。

因为我不加这句,它就不是从文档中来回答我的问题了,而是联网搜索来回答我的问题。宝子,你这很通义啊!

行吧,就不大海捞针难为你了。我们来看下你的总结能力。

input:阅读全文总结,三体人有哪些特征?

这是Kimi的回答:

这是橙篇的回答:

这是元宝的回答:

卧槽,看得我一口老血都要喷出来了……大刘什么时候描述过三体人的外貌特征了?

还有,你知道能在4光年外的三体世界精确看到地球上的事物,有多么牛逼和科幻吗?凭人眼根本不可能实现!这是智子的同传功能,它是通过量子通信实现的,而不是三体人的眼睛。

你不会回答,别瞎jb答啊。这个回答真的是,错得太离谱了……这道题Kimi及格,橙篇优秀,元宝0分。

回答速度上,元宝确实比较快,不到10s就答出来了。其他几个AI,橙篇回答速度在10-20s左右,Kimi怎样都要30s以上。

原来你这么快,是有原因的。

复现官方玩法

1)读表画图

腾讯混元发文称,元宝可以对Excel表格进行解析,并生成柱状图。

我下载了一份微信文章的阅读数据,让元宝帮忙分析分析。

input:总结表格中阅读次数最高的渠道是谁?画出各渠道的平均均阅读次数的柱状图,并在条住顶端分别标注平均阅读次数。

这分析过程,把我看懵了……而且它还知道排除“全部”。

我一共给到了元宝278行数据,它知道如何在海量数据中定位信息,进行计算并出图。这波复现完成度,满分。

2)URL网址总结与分析

腾讯混元还介绍,元宝能解析URL和各类链接,并对链接里的内容进行总结和对比分析。

input:用表格形式对比两个链接内容,并分析去掉了哪些AI?

我让元宝总结对比了我们的AI产品榜(5月和6月),看看在推荐里去掉了哪些AI?

这总结,非常靠谱啊!完美复现!

3)RAG优化

腾讯元宝,还对AI搜索进行增强(RAG),接入了微信搜索、搜狗搜索等搜索引擎,不仅覆盖了微信公众号等腾讯生态内容,还囊括了其他互联网的权威信源。

今天,Ilya成立新公司,刷爆了AI行业。依托公众号的信源,元宝完美答对了。

而且,追问质量也很高。

元宝能够识别出与用户提问高度相关的内容,进行精炼总结,提供更好的延伸阅读。

不得不说,依靠公众号,腾讯元宝拿到了很大的先发优势。

4)小插曲

在上一篇测评元宝的文章中,我很想体验《庆余年》智能体,但是web端和app端都用不了。

今天再次测试,已经可以用上了,给混元团队加个鸡腿。

但是历史会话查询和新会话切换,还是没改。你要查历史会话,就得一直往前翻……

最后,打个总结。

元宝的1000万上下文,你听听就好,千万别信。如果是几万、几千token以内,元宝的质量还是能打的。

元宝,与别家AI拉开差距的地方,目前有且只有一个——那就是公众号的信源。别家用不了,只有鹅厂自己的AI能用。

这就是元宝最大的优势。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅