2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

基于大模型的MaaS工业应用分析与思考

发布日期:2024-04-12 06:43:19 浏览次数: 4776
作者:清华大学互联网产业研究院

微信搜一搜,关注“清华大学互联网产业研究院”



基于大模型的MaaS工业应用分析与思考
文/冷语欣  栾晓曦  罗培
清华大学互联网产业研究院

2023 年初,社交网络上出现了一阵晒出与 ChatGPT 的聊天截图风潮,这也是 ChatGPT 被大众认知最广的一个功能——智能交互对话[1]。ChatGPT 是美国人工智能研究实验室 OpenAI 开发的一种全新聊天机器人模型,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,支持回答问题、承认错误、质疑并拒绝不适当的请求等情境[2]。中国信息通信研究院联合中国人工智能产业发展联盟对 ChatGPT 进行的测试显示,ChatGPT 在百科检索、数学问答、文学交流、常识问答、知识推理等对话任务上的意图识别率均达到 98% 左右,在生活闲聊上的意图识别率约为 95%,已具备较好的语义理解能力[3]

01


生成式预训练Transfomer模型

GPT 的全称为 Generative Pre-Trained Transformer,即生成式预训练 Transfomer 模型。基于 GPT 架构,OpenAI 构建了可以应用在多种任务上的大规模语言模型,并成功应用在商业领域。大规模语言模型 Large Language Model (LLM)是一个基于 Transformer 的神经网络,由具有许多参数(通常为数十亿个权重或更多)的神经网络组成,使用自监督学习在大量未标记的文本上进行训练。而 2022 年初推出的 InstructGPT 引入新技术 RLHF(基于人类反馈的强化学习),该技术可以直接从人类反馈中训练“奖励模型”。当处理包含人类价值观和人类偏好的复杂任务,包括但不限于文本分类、生成文本以及回答问题[4]时,RLHF 可以生成与人类价值观相符的答案,并能够拒绝与其价值观不符的任务。这提高了强化学习的鲁棒性和探索性。

Transformer 模型来自谷歌 2017 年发表的论文《Attention is all you need》,作为一种采用自注意力机制(Self-Attention)的深度学习模型,Transformer 是目前常见大规模语言模型的核心组件。模型按照输入数据各部分的重要性的不同而分配不同的权重。

该模型颠覆了传统的循环神经网络 (RNN)和长短时记忆网络(LSTM)的建模范式,在自然语言处理任务中取得了显著的成功。

Transformer 的优势在于:


采用并行训练,大幅提高了训练效率;


能够在处理文本时捕获长距离依赖关系,避免了传统 RNN 和 LSTM 中的梯度消失问题。


可以应用于多种自然语言处理任务,如文本生成、分类、翻译等,具有很高的通用性。


经过多次迭代,参数量大幅提升。


Transformer 结构的提出,使得深度学习模型参数突破了 1 亿。从 lenet、Alexnet、ResNet 开始,模型参数日益增长。到了 BERT 网络模型的提出,参数量首次超过 3 亿规模,鹏程盘古实现千亿参数规模,OpenAI 于 2020 年 5 月推出第三代 GPT-3 模型参数量达 1750 亿。

目前,通用大模型已经成为人工智能领域的研究热点,国内外均有研究成果和商用模型陆续发布。其中国外大模型研究起步较早,OpenAI、谷歌等公司为代表经过多年研究,大模型版本不断迭代,规模逐渐扩大,性能不断提升(表1)。

表 1 国外主要大模型

国内目前已有百度、阿里等互联网头部企业入局,另有清华大学、复旦大学、中科院等科研院所以及商汤科技、智谱 AI 等人工智能企业已发布或在研大模型产品(表2)。

表 2 国内主要大模型


02


大模型是新一代的“操作系统”

Transformer 模型可并行运算的特性和出色的可扩展性为人工智能模型向通用大规模发展奠定了基础。一方面,Transformer 架构结构灵活,具有很强的可扩展性。通过增加层数、注意力头数等方式,根据任务和数据集规模的不同调整模型规模、改进模型性能,这为开发更大规模、更强大的模型提供了可能。另一方面,Transformer 具有良好的并行化能力,这使得其能够处理大规模数据集。

在大规模数据和计算资源的支持下,基于 Transformer 可以设计并训练参数规模上亿的大模型。这种大模型具有更好的泛化能力和性能,能够应对更加复杂的处理任务,并逐渐进入到可以大规模、可复制的大工业落地阶段[5],应用于细分领域的下游任务。

△ 图1 大模型与应用下游任务

(图源https://arxiv.org/pdf/2108.07258.pdf)

清华大学讲席教授、智能产业研究院院长张亚勤在《AI大模型时代》的演讲中指出,“GPT+ 等各种大模型是人工智能时代的“操作系统”,对上层应用有重构、重写的作用。”不同的时代有不同的操作系统,它们决定了服务器架构和应用的形态。人工智能时代,大模型将成为底层的操作系统,芯片架构包括 GPU、CPU、XPU,上层的云计算架构将从 IaaS–PaaS–SaaS,演变为 IaaS– 垂直模型/MaaS/基础模型 –SaaS。

△ 图2 大模型时代下重塑的云计算架构

上海大学计算机工程与科学学院邹国兵教授于 2012 年就提出了“MaaS”(模型即服务)的概念:MaaS 由基础层、中间核心层和底层扩展层三部分构成。

△ 图3  MaaS理论模型

基础层包含用户的身份信息,如姓名和职业等;中间核心层涉及用户的重要特征,如兴趣、偏好、目标等;底层扩展层含有个性化知识的用户特征,如通过语义分析和推理得到的兴趣、偏好和模型网络。基础层、中间核心层和底层扩展层共同构建了一个 MaaS 平台。平台可以作为独立的服务平台,嵌入到云计算中,位于 PaaS 层和 SaaS 层之间。从 MaaS 的构成得以看出,它可以利用IaaS层收集的个人信息,生成个性化的模型网络。百度创始人李彦宏在“文心一言”发布会上表示大模型时代下,将会产生新型云计算公司,其主流商业模式也将从 IaaS 变为 MaaS[6]

03


MaaS 应用对生产制造行业的影响

大模型时代下,需要拥抱以工业大模型为基础、轻量化微调的 MaaS 服务,快速形成智能化的 MaaS 应用,优化传统工业互联网赋能方式,推动我国工业化进程[7]

在开发设计方面,开发人员可以直接通过自然语言生成代码,提升产品易用性和个性化程度。PaaS 的开发可以基于 MaaS 平台,或者直接由 MaaS 替代,实现数据和功能的定制化。应用模型的图像生成能力,设计人员可以用更低的时间成本进行三维可视化设计,建立智能工业知识库。例如:汽车外形的研发设计可以直接通过大模型生成并给出对应的设计说明及优缺点,辅助设计师创新。

在生产制造方面,大模型能在生产制造流程中帮助工人精准设定设备的工艺参数,提供有效的精细化操作指引,在突发故障时提供快速诊断和应急解决方案建议。例如:针对复杂的仪器设备和多流程的工艺环节,大模型可以自动生成各环节工艺参数,并在数字孪生系统进行仿真输出报告供人类选择。

在运营管理方面,大模型通过对 ERP、CRM、SRM 等系统的运营数据与模型代码的理解,用户直接使用自然语言描述需求,生成仪表盘、报告或 AI 分析。同时也能与图像识别处理系统、时间序列分析等系统融合,通过深层次、多维度的数据分析。例如:大模型直接生成Excel并进行数据分析,供管理人员了解整个工厂的运营情况、提供可参考的最终决策。

在产品服务方面,大模型可以提高响应效率并创新产品服务形式。既可以通过智能客服的形式协助人工进行会话、业务处理、操作讲解,也可实现社媒推广、智能面试等创新服务。例如:大模型可以充当社交媒体 KOL,为抖音、微博、微信公众号等各种平台创建内容并与关注者互动,以推广产品或服务。

在人员培训方面,大模型可以被视为一个规模庞大、拥有专业知识体系的数据库,通过与员工的交互来输出知识,在工业领域的人员培训中多功能应用,实现智能培训。例如:模拟如应急事件、安全事故等各种突发场景,让员工在模拟实践中学习应对突发情况的方法和技能。

然而互联网领域通用的 AI 模型开发和应用与工业领域有着非常明显的差异,主要体现在数据、需求规模、精度要求、算力支持、模型部署等五个方面 [8]。百度、腾讯、阿里巴巴、华为等国内科技企业在 MaaS 领域已经展现了强大的研发实力和实践能力,在工业领域模型应用上探索了路径。百度 Apollo 提供自动驾驶、智能汽车、智能交通等解决方案;文心大模型构建了“基础+任务+行业”的三级模型体系,基础大模型支撑任务与行业大模型的建设,任务和行业大模型结合真实场景与数据反哺基础大模型优化;腾讯混元协同了腾讯预训练研发力量,完整覆盖 NLP、CV、多模态及众多行业领域任务模型;阿里巴巴“通义”大模型基于 AI 统一底座构建了通用模型与专业模型协同的层次化人工智能体系,支撑了电商、金融、物流等多个场景;华为云“盘古大模型”与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts 平台深度结合,已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。

因此,在行业大模型的构建和应用方面,应引导 AI 模型研发供应商与制造类链主企业展开充分对接,形成数据、训练、治理全套服务的大模型开源生态体系。朱岩教授在《2023年中国数字经济发展的十个趋势》一文中提出预测,如同 2C 的大型平台经济企业一样,在 2B 领域也将涌现大量新型的产业数字服务平台企业。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅