2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

火山引擎打通了「AI+硬件」的最后一纳米

发布日期:2024-12-31 07:55:26 浏览次数: 3010
作者:阑夕

微信搜一搜,关注“阑夕”


1939年,一台会说话的机器人,震惊了造访纽约世博会的每一个游客。
机器人名叫Elektro,造型酷似「绿野仙踪」里的铁皮人,不过覆满全身的是铝板,且被涂成了古铜色,它由西屋电气生产,在设计上带有典型的工程师风格。

在展台上,Elektro口齿清晰的发表自我介绍:「女士们,先生们,我很荣幸见到各位,我是一个聪明的家伙,因为我的大脑里有48个继电器。」
Elektro甚至能够表现出幽默感,当有游客停下来打量它时,它就会冷不防的来上一句:「我的大脑比你大」。
这也是实话,因为那48个继电器加起来重达25公斤,远非人类可以比拟。
兴奋的媒体很快就把Elektro当成未来已至的造物,用尽一切溢美之词赞美这个时代的科技奇观,但不出意外的,意外还是虽迟必到。
西屋电气很快承认,Elektro其实并不是真的会说话,所有的语音指令,都是提前录制好的,由操作员控制播放,那些充满机锋的对话,也只是经过编排的剧本。
虽然好莱坞还挺喜欢Elektro的——它客串了不少电影,多少也启发了C-3PO的造型——但在市场噱头幻灭之后,Elektro还是被扔进了报废仓库,成为历史长河里数不清的过客之一。
不过人类还是不曾放弃创造智能物种的念想,近一个世纪以来,人工智能的探索曲折蜿蜒,终于在这几年的大模型浪潮里,第一次接近了为无机物赋予生命并和「它们」平等对话的可能。
而看着哆啦A梦长大的一代人,也开始有机会制造下一代人的哆啦A梦了。
· · ·
2024年的最后一个月,火山引擎在上海举办了Force原动力大会,AI继续担当主角并不让人感到意外,但AI落地到硬件的场景崭露头角,还是有些科幻走进现实的味道。
想象一下,未来的潮玩和手办,将不再只能放在展示柜里观赏,而是每一个都内置「人格」,可以随时响应用户的召唤,和他们对答如流的畅谈诗与远方,这会带来怎样颠覆性的产业变革?
越来越聪明的大模型看上去已经能够胜任这样的角色了,但真实的工业生产,从来不是把软件装在硬件里,就能解决一切需要,在火山引擎参与「组局」之前,对话式AI+硬件最大的问题其实在于——AI感的无法消除。
在日常的使用场景里,普通人大概体会不到主流智能手机的计算性能和操作系统有多强大,然而一旦将同样的大模型置于千元以内的硬件终端里,那种交互上的违和感很快就会出现。
比如反应变慢,一句话问完要等好几秒后才有回应,或是无法像自然对话那样随时打断,往往用户插嘴后AI还在滔滔不绝的输出既有内容,再就是对弱网场景支持不足,在接收指令时丢失了关键信息,以致于已读乱回的情况时常发生。
加上在多模态的环境里,人与AI之间的交互,不仅有低带宽的文本和语音,还会包含高带宽的视觉影像,以及情绪模拟的个性化适配,这就更加考验端侧音视频处理的能力了。
理解了将AI和硬件组合在一起的难度,也就理解了为什么火山引擎要来推出解决方案,就商业逻辑而言,让硬件公司专注于消费制造,让软件平台专注于模型开发,是效率最高的最优解,而中间的粘合环节,恰好就是火山引擎的擅长领域。
毕竟,在实时音视频RTC配合AI接入的这条技术线上,火山引擎可能是云计算厂商里,走得最远的那一家。
· · ·
火山引擎对于RTC技术的长期投入,让它同样成为对话式AI的方案供应商,昔年的深耕穿越至今结出硕果,倒是有些「养兵千日,用兵一时」的意思。
世界杯的多人观赛、抖音的直播连麦、飞书的多人会议……从规模负载来看,火山引擎RTC的实战积累,也是全球领先的,所以当AI交互的新场景出现后,火山引擎并不需要重新造轮子,而是可以直接站在先进经验的山头,另起青云。
于是,不到半年时间,火山引擎就从发布实时对话式AI方案、向着行业喊话的试探性角色,上升到了联合IoT领域的国产龙头乐鑫科技正式支持硬件制造商们入局的核心圈玩家,同时火山引擎也和这几家厂商联合发布「硬件+对话式AI」智跃计划。
乐鑫科技是做IoT芯片的,全球出货量累计超过了10亿颗,是这个细分市场的头部公司,在大会专场上做了30分钟的演讲。
其中有一个比喻非常通俗:在这一轮AI潮玩造物的产业分工里,硬件生产商,相当于是在制造「肉体」,乐鑫这类集成电路设计企业,负责构建「大脑和神经」,而接进来的各种大模型,则承担着赋予「灵魂」的使命。
以此类推,火山引擎作为云服务平台的价值,就是为上述器官提供一套「生命系统」,从消化到代谢,从呼吸到知觉,确保智能的平稳运行
具体来说,乐鑫专为AIoT市场供应的的ESP32-S3芯片,将会集成火山引擎的RTC能力,内置一套「即插即用」的大模型语音交互模组,把端到端的响应延迟压到可在1s以内,还能灵敏识别用户的打断意图,还原人机(大模型)之间的真人感对话。
直接调用豆包大模型后,还能获得最新的多模态交互技术,让潮玩等AI硬件可以「看到」甚至「察觉」用户的情绪,可以持续与AI持续对话,不用「一按一问」。
随着前沿技术的溢出,硬件消费品可能到了最合适的下场时机,互联网产业上游都在致力于提供一站式保姆服务,万事俱备,只欠产品。
· · ·
加入这场「硬件+对话式AI」盛宴的潮玩品牌ToyCity,是一家典型的制造业厂商,前身曾是东莞数千家玩具代工厂里的一员,为高达、米老鼠、变形金刚等一线玩具品牌生产组件。
2020年,创始人郑波决定开创自己的设计师玩具品牌,这也是过去十几年来并不少见的,从中国制造到中国智造的产业升级叙事。
在分享环节,郑波拿出了ToyCity旗下最成功的原创IP「耙老师」,认为这只在潮玩圈里家喻户晓的熊猫非常适合成为公司史上第一代AI潮玩的形象,可爱无害,柔软可捏,情绪价值拉满。
在郑波看来,他看好AI潮玩迎来普及化的机会,是基于专业,而这里的专业,指的不只是ToyCity的设计能力,还包括专业的芯片、模型和对话技术,一切的水到渠成,都取决于各方都把自己的专业打磨到了可以直面市场的程度。
和ToyCity一起「入伙」的,还有新兴的潮玩品牌FoloToy,曾以对儿童玩具火火兔的AI化改造一夜成名,以及面向年轻女性市场的珞博智能、为普通人打造赛博伙伴的魂伴科技,它们的共同点在于,相信潮玩的陪伴价值,会在原子化的未来社会里被无限放大。

比如要想实现魂伴科技的愿景,就对交互技术有着极高要求,AI不应该止步于有问必答的工具人,更应该充当打破次元壁的个人CP,它甚至可以笨一点,需要人的关怀和陪伴,双向输出情绪价值,让AI和人性一起成长。

在魂伴科技的使命里,「复活」人们耳熟能详的那些经典IP,是最有价值的链条所在,让分院帽、宝可梦、红小豆这些可被抱在怀里的柔软玩具,成为像影视剧里表现出来的,可以不分昼夜的陪在用户身边,随时回应情感需求,在这样的时刻,市场对于玩具的估值和期待,将得到彻底改写。

为了证明自身的存在不是孤独的,人类可以制作出经过10亿年都不会腐朽的金唱片,让旅行者号探测器带着它飞向宇宙深空,而在不需要远离地球的另一条技术线上,以造物主的身份创造出数字化的同类,也能抵达同样的终岸。


而且,这也不是局部的认知,而是全球的共识。
今年8月,OpenAI投资了一家不起眼的初创公司Heeyo,其产品就是利用大模型打造儿童的数字玩伴,由哈佛和斯坦福的心理学家参与设计,可以提供早期教育的定制化服务。
即使是在「少子化」的日本,玩具市场在过去一年的增长,依然保持在7.1%的高位,无论是儿童还是成人,都在对抗孤独这件事情上,有着强烈的需求意志。
玩具的AI化,是在功能性和娱乐性的基础上,把那些「无用之物」变成了赛博时代的生命体,并将另一个数量级的陪伴市场嫁接过来,虽然很难估量交叉之后的产值,但让从业者燃起兴奋,是毋庸置疑的。
· · ·
就像Google Pixel的存在意义是给各家Android手机厂商「打样」,火山引擎今年中秋定制的毛绒玩具「显眼包」,也给AI+硬件这条赛道,做了一次很有意思的启蒙示范。
在二手平台,「显眼包」的交易价格已经上涨到了300-500块钱不等,这个萌翻众人的火山拟人玩偶,以其「体形虽小,智慧俱全」的对话体验,在没有量产计划的情况下,依然火出圈了。

或者说,卷模型的事情,就交给大厂们去砸钱,站在制造业大国的路径上,高度成熟的供应链资源,是不应该被浪费的,最难的技术链打通之后,压力就来到了最需要创意和情感的消费级市场。
根据第三方招聘平台的数据,AI的大浪袭来,再度复兴了产品经理这个古典职业,在国内新经济行业今年的新发岗位数量上排名第一,新闻里的AI隔三差五就出王炸,普通人的感知却长期偏弱,中间横亘的深邃鸿沟,需要更多的大众向产品来填平。
不只是玩具,在广义的AIoT市场里,万物的感知系统一定会越来越强,未来所有的生活场景都离不开软件,而软件则生长在云设施上,从支持人和物的对话开始,火山引擎的历史使命,也是从万物的IT化,到万物的AI化。
俄亥俄州的曼斯菲尔德纪念馆后来收藏了Elektro的遗骸,配上的文字充满深意:「每天都有改变历史的发明被扔进垃圾桶里。」
而在今天,所有投身AI赛道的建造者,都有机会亲手把科幻电影里的未来实现在近在咫尺的前方,怎么看,这都是一件高燃的事情

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅