2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

AI已精,硬件何愚?

发布日期:2025-03-04 05:15:13 浏览次数: 2351
作者:机器之心

微信搜一搜,关注“机器之心”

推荐语

AI大模型虽强,智能硬件如何突破瓶颈?

核心内容:
1. 头部厂商系统级智能体接入DeepSeek-R1现状
2. 端侧设备部署LLMs面临的挑战与需求
3. 推进端侧模型发展的技术进展与趋势

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

近期,华为、联想、星纪魅族等头部厂商陆续宣布了其系统级智能体接入 DeepSeek-R1。尽管 LLM 逐渐朝着人类思考的方式靠近,但接入 AI 大模型的智能终端设备实际体验并不佳,离真正的智能还有很远的距离。

传统的 LLMs 主要部署在云服务器上,但存在着延迟、数据隐私安全和联网等等局限性。而随着智能手机、汽车和可穿戴设备等设备的智能化趋势,能在边缘设备上直接部署 LLMs 成为关键需求。

目录

01. DeepSeek 都这么强了,为什么端侧的智能硬件还是不太聪明的样子?

DeepSeek 都这么强了,为什么智能设备还是不太聪明的样子?在端侧设备上直接部署运行 LLMs 有哪些难题?为什么终端厂商又非要把 LLMs 放在端侧运行?

02. 端侧小模型正在变强吗?能在端侧运行的小模型的「知识密度」也有 Scaling law?

端侧小模型正在变强吗?能在端侧运行的小模型的「知识密度」也有 Scaling law?

03. 近期有哪些值得关注的工作在推进端侧模型的发展?有哪些技术正在让端侧模型变得更强?

有哪些值得关注的让端侧模型变得更强的技术?...

01  DeepSeek 都这么强了,为什么端侧的智能硬件还是不太聪明的样子?
1、近期,华为、联想、星纪魅族等头部厂商陆续宣布了其系统级智能体接入 DeepSeek-R1。尽管 LLM 更加朝着人类思考的方式靠近,但接入 AI 大模型的智能终端设备实际体验并不佳,离真正的智能还有很远的距离。
2、传统的 LLMs 主要部署在云服务器上,但存在着延迟、数据隐私安全和联网等等局限性。而随着智能手机、汽车和可穿戴设备等设备的智能化趋势,能在边缘设备上直接部署 LLMs 成为关键需求。
① 据 Market.us 数据显示,2022 年至 2032 年,按最终用户划分的全球设备端边缘人工智能市场规模正在以 25.9%的复合年增长率增长。
② 以延迟为例,如 LLMs 能够直接在终端设备上运行推理,而不是将数据发送到云服务器,将有效地减少生成时间,更满足于需要实时响应的应用。
② 同样,在终端设备上直接部署运行 LLMs,可以在离线的环境中运行,减少了对网络的依赖。
3、但在有着不同限制条件的边缘设备上,整合运行计算密集型的 LLMs 面临非常大的难题,诸如计算能力、内存容量、算力等的限制,难以满足大模型的微调和推理需求。其中,端侧算力不足是难以在端侧「跑」大模型的最为核心的难题。
① 端侧设备的硬件能力的物理限制与大模型计算需求的指数级增长存在根本性矛盾。以 70 亿参数模型为例,单次推理需约 25GB 显存和万亿次浮点运算,而主流端侧设备(如手机 NPU)的算力通常低于 100TOPS(如骁龙 8 Gen3 的 45TOPS)、内存不足 12GB,无法实现实时计算。
② 同时,由于大模型的计算密集型特性会导致功耗激增,端侧设备因电池和散热限制而无法持续高负载运行。
难以实现平衡算力、能耗与精度的「不可能三角」,是端侧设备直接部署大模型面临的本质性难题。
③ 此外,以 DeepSeek 为例,尽管 DeepSeek 带来了训练和推理成本指数级下降,边端侧模型可用性明显提高。DeepSeek 通过模型压缩、量化等技术降低了对端侧算力的需求,但边端算力资源受限仍是主要挑战。
4、因此,端侧模型变得更为重要,成为研究的爆发趋势方向。端侧模型是指部署在智能手机、PC、可穿戴设备、自动驾驶汽车、具身机器人等终端设备上的预训练模型。因为终端设备的计算资源有限,端侧模型的特点是「轻量化」,需要特别设计来减少模型大小和模型架构。
5、现有的端侧模型通常由更高一级的基础大模型蒸馏而来。DeepSeek 在其技术报告中也提到,对于参数规模在 7B 以下的小型模型,可以采用知识蒸馏技术,利用一个性能优异的大型教师模型来生成高质量的思维链数据,这种方法能够显著提升小模型的推理能力,且在效果和效率上优于直接强化学习。
6、但在 PC、机器人、自动驾驶汽车等智能终端的实际场景中,往往需要专门去做定制的端侧模型,而不是使用基础大模型直接进行蒸馏。原因在于:
① 一是基于硬件的约束。在终端场景,通常要求毫秒级实时响应(如自动驾驶 10ms 决策)、严控算力(如 NPU 的 40TOPS 适配)、存储压缩(如机器人 32GB 内存限制)及能耗优化(如特斯拉模型降耗 40%)。相比于直接蒸馏的大模型,定制的端侧模型能够需通过剪枝、量化等定制技术实现极致效率;
② 二是场景的特异性。需针对性强化领域知识(如医疗机器人融合解剖图谱)、多模态协同(如激光雷达与视觉融合)和长尾场景覆盖(如暴雨路况优化),而通用大模型蒸馏难以适配垂直需求;
③ 三是蒸馏的局限性:蒸馏存在知识迁移损耗(如隐私数据无法云端蒸馏)、架构冗余(如多头注意力机制)和无法动态迭代(如端侧联邦学习实时更新)等局限。


02  近期有哪些值得关注的工作在推进端侧模型的发展?有哪些技术正在让端侧模型变得更强?
自 2023 年开始,关于边缘设备上的大型语言模型的研究开始真正兴起。诸如 Meta 的 LLaMA 系列、微软的 Phi 系列、谷歌的 Gemma 系列、Nexa AI 的 Octopus 系列模型等。同时,近期也有不少端侧模型、小模型的相关研究工作进展 ......

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅