2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

发布日期:2024-07-24 19:54:21 浏览次数: 2453
  • 借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对,来构建“超级模型”


  • NVIDIA AI Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成式 AI 模型服务,以便部署自定义 Llama 3.1 NVIDIA NIM 微服务和新的 NVIDIA NeMo Retriever 微服务,以实现准确响应


  • 埃森哲率先使用新服务,为客户创建自定义 Llama 3.1 模型;Aramco、AT&T、优步和其他行业领导者率先使用全新 Llama NVIDIA NIM 微服务




NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM™ 推理微服务,与同样刚推出的 Llama 3.1 系列开源模型一起,为全球企业的生成式 AI 提供强力支持。


借助 NVIDIA AI Foundry,企业和各国现在能够使用 Llama 3.1 以及 NVIDIA 软件、计算和专业知识,为其特定领域的行业用例创建自定义“超级模型”。企业可以使用自有数据以及由 Llama 3.1 405B 和 NVIDIA Nemotron™ Reward 模型生成的合成数据,来训练这些超级模型。


NVIDIA AI Foundry 是由 NVIDIA DGX™ Cloud AI 平台驱动。该平台由 NVIDIA 与全球领先的公有云共同设计,旨在为企业提供大量计算资源,所提供的计算资源可随着 AI 需求的变化轻松扩展。


企业以及制定主权 AI 战略的国家正希望创建具有特定领域知识的自定义大语言模型,以便生成式 AI 应用能够反映其独特的业务或文化。因此,这些新服务的推出恰逢其时。


NVIDIA 创始人兼首席执行官黄仁勋表示:“Meta 的 Llama 3.1 开源模型标志着全球企业采用生成式 AI 的关键时刻已经到来。Llama 3.1 将掀起各个企业与行业创建先进生成式 AI 应用的浪潮。NVIDIA AI Foundry 已经在整个过程中集成了 Llama 3.1,并能够帮助企业构建和部署自定义 Llama 超级模型。”


Meta 创始人兼首席执行官马克·扎克伯格表示:“全新的 Llama 3.1 模型是开源 AI 迈出极其重要的一步。借助 NVIDIA AI Foundry,企业可以轻松创建和定制大家想要的最先进的 AI 服务,并通过 NVIDIA NIM 进行部署。我很高兴能将它交付到大家手中。”


企业现在可以从 ai.nvidia.com 了解适用于 Llama 3.1 模型的 NVIDIA NIM 推理微服务,以加快将 Llama 3.1 模型部署到生产级 AI 的速度。NIM 微服务是将 Llama 3.1 模型部署到生产中的最快途径,其吞吐量最多可比不使用 NIM 运行推理时高出 2.5 倍。


企业可以将 Llama 3.1 NIM 微服务与全新 NVIDIA NeMo Retriever NIM 微服务组合使用,为 AI copilot、助手和数字人虚拟形象搭建先进的检索工作流。


埃森哲率先使用 AI Foundry 

为企业创建自定义 Llama 超级模型


全球专业服务公司埃森哲率先借助 NVIDIA AI Foundry,使用 Accenture AI Refinery™ 框架为自己以及那些希望所部署的生成式 AI 应用能够反映其文化、语言和行业的客户来创建自定义 Llama 3.1 模型。


埃森哲董事长兼首席执行官 Julie Sweet 表示:“全球领军企业看到了生成式 AI 正在如何深入改变各行各业,并且希望部署由自定义模型驱动的应用。埃森哲的内部 AI 应用一直在使用 NVIDIA NIM 推理微服务。现在,借助 NVIDIA AI Foundry,我们能够帮助客户快速创建和部署自定义 Llama 3.1 模型,为他们的优先业务事项提供变革性的 AI 应用。”


NVIDIA AI Foundry 提供一种可用于快速构建自定义超级模型的端到端服务。其结合 NVIDIA 软件、基础设施和专业知识与开放社区模型、技术和来自 NVIDIA AI 生态系统的支持。


借助 NVIDIA AI Foundry,企业能够使用 Llama 3.1 模型和 NVIDIA NeMo 平台(包含在 Hugging Face RewardBench 上排名第一的 NVIDIA Nemotron-4 340B Reward 模型)创建自定义模型。


在创建了自定义模型后,企业就可以构建 NVIDIA NIM 推理微服务,以便在其首选的云平台和全球服务器制造商提供的 NVIDIA 认证系统™上,使用自己选择的最佳机器学习运维(MLOps)和人工智能运维(AIOps)平台在生产中运行这些模型。


NVIDIA AI Enterprise 专家和全球系统集成商合作伙伴与 AI Foundry 客户一同加快从开发到部署的全过程。


NVIDIA Nemotron 

为高级模型自定义提供助力


如果企业需要更多训练数据来创建特定领域的模型,可以在创建自定义 Llama 超级模型同时使用 Llama 3.1 405B 和 Nemotron-4 340B 生成合成数据,以提高模型的准确性。


拥有自己的训练数据的客户可以使用 NVIDIA NeMo 对 Llama 3.1 模型进行自定义,通过领域自适应预训练(DAPT)进一步提高模型的准确性。


NVIDIA 和 Meta 还一起为 Llama 3.1 提供了一种提炼方法,供开发者为生成式 AI 应用创建更小的自定义 Llama 3.1 模型。这使企业能够在更多加速基础设施(如 AI 工作站和笔记本电脑)上运行由 Llama 驱动的 AI 应用。


行业领军企业纷纷使用 

NVIDIA 和 Llama 为 AI 提供强力支持


医疗、能源、金融服务、零售、交通、电信等行业的企业已在使用适用于 Llama 的 NVIDIA NIM 微服务。首批使用面向 Llama 3.1 全新 NIM 微服务的公司包括 Aramco、AT&T 和优步。


Llama 3.1 多语种大语言模型(LLM)集合是一个具有 8B、70B 和 405B 三种参数规模的生成式 AI 模型集合。该集合中的模型在超过 16,000 个 NVIDIA Tensor Core GPU 上训练而成,并针对 NVIDIA 加速计算和软件(无论是在数据中心、云以及配备 NVIDIA RTX™ GPU 的本地工作站或配备 GeForce RTX GPU 的 PC 上)进行了优化。


全新 NeMo Retriever RAG 

微服务大幅提高准确性和性能


通过使用全新的 NVIDIA NeMo Retriever NIM 推理微服务来实现检索增强生成(RAG),企业可以将自定义 Llama 超级模型和 Llama NIM 微服务部署到生产中,以提高响应准确性。


当与适用于 Llama 3.1 405B 的 NVIDIA NIM 推理微服务结合使用时,NeMo Retriever NIM 微服务可以为 RAG 工作流中的开放和商业文本问答带来极高的检索准确性。


企业生态系统为 Llama 3.1 

和 NeMo Retriever NIM 部署提供助力


数百家提供企业、数据和基础设施平台的 NVIDIA NIM 合作伙伴现在能够将这些新的微服务集成到其 AI 解决方案中,从而为 NVIDIA 社区 500 多万开发者和 1.9 万家初创公司的生成式 AI 提供超强助力。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅