2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

Vertex AI:立足企业需求,打造卓越的生成式 AI 平台

发布日期:2024-07-09 21:16:08 浏览次数: 3378
作者:谷歌云服务

微信搜一搜,关注“谷歌云服务”

过去的一段时间,我们看到了许多 Google Cloud 客户对生成式 AI 和 agent 的精彩应用,令我们拍案叫绝。为了让企业能够更快推出功能强大的 AI agent,Google DeepMind 在模型技术方面积极探索创新,尤其着力于 Gemini 和 Imagen 的改进。我们的企业 AI 平台 Vertex AI 也推出了数十项突破性功能。



包括 UberEats、Ipsos、Jasper、Shutterstock、Quora 等众多领先组织在内,客户纷纷运用生成式 AI 创造出色成果,在 Google Cloud 的助力下加速生成式 AI 应用投产。


例如,在 Gemini 1.5 Pro 推出前,大多数多模态用例(像提交一个视频并轻松询问与视频内容相关的问题)都还停留在构想阶段。但自新模型推出以来,我们已经看到许多围绕数据开展对话的客户创新实例,包括:


一家快餐零售企业

使用 Gemini 分析店面的监控录像,据之识别客流高峰时段并优化店内布局,从而提升客户体验。他们还计划将视频分析与销售数据结合起来,更好地理解有哪些因素有助于提高服务效率和满意度。


一家金融机构

需要处理通过数据表单提交的身份证件扫描图像。他们利用 Gemini 的多模态功能自动快速地处理图像和文本,一方面对比信息的准确性,一方面帮助客户更方便地开设和访问账户。


一家体育公司

使用 Gemini 来分析球员的挥杆动作。将 Gemini 的数据洞察力融入其现有应用后,他们成功利用 AI 分析结果增强了挥杆动作分析工具的功能。


一家保险公司

现在可以利用 Gemini 分析行车记录仪的事故录像,更好地理解和描述事故场景。这项分析不但可协助计算风险评分,甚至可根据观察到的司机行为提供个性化的驾驶建议。


一家广告和营销服务公司

开发出面向实时流媒体的描述和旁白功能,实现了变革性的视频描述解决方案。这一创新简化了视频创作过程,提高了效率,并为个性化内容铺平了道路。


而这些都只是结合多模态功能和长上下文窗口的应用,Gemini 在处理代码库、配图长文档、音频访谈等方面的能力同样强大。


除了客户的热烈反响,行业分析师的认可也令我们倍感鼓舞。例如,仅在过去两个月里,不但 Forrester Research 在《The Forrester Wave™:AI 语言基础模型,2024 年第二季度》中将 Google 评为业界领导者,Gartner® 也在《2024 年云 AI 开发者服务魔力象限《2024 年数据科学和机器学习平台魔力象限中将 Google 评为业界领导者。


今天,为了加速这一势头,我们很高兴地公布 Vertex AI 在模型和企业平台功能方面的一些重大进展。

 

下面先从模型说起。



Gemini 1.5 Flash:

领先市场的性价比和低延迟


上个月,我们发布了 Gemini 1.5 Flash 的公开预览版。现在,这个新模型已正式推出。它兼具低延迟、实惠价格和突破性的 100 万 token 上下文窗口等多项优势,是各种大规模应用场景的理想选择。从零售聊天客服到文档处理,再到合成整个知识库的研究 agent,它都能灵活满足客户所需。


最重要的是,Gemini 1.5 Flash 的强大功能、低延迟和高性价比迅速成为我们客户的最爱。相较于 GPT 3.5 Turbo 等同类模型,它具备多项显著优势:


100 万 token 的上下文窗口,约为 GPT-3.5 Turbo 的 60 倍

在输入 10,000 字符的情况下,平均速度比 GPT-3.5 Turbo 快 40%

● 输入成本比 GPT-3.5 Turbo 最高可低 4 倍(对超过 32,000 字符的输入启用上下文缓存)


“UberEats 正积极重新构想人们获取日常生活所需的方式,”Uber 资深软件工程师 Narendran Thangarajan 说道,“因此,我们开发了 Uber Eats AI 助手,让我们的用户能够通过自然语言对话,轻松顺畅地探索、发现和购买我们商品目录中的各种好物。Gemini 1.5 Flash 让我们的响应时间几乎减半,而这对整体客户体验至关重要。我们非常期待这一模型在提高效率和客户满意度方面的潜能,以及它的多模态功能和更长上下文窗口带来的新机会。”


“Gemini 1.5 Flash 让我们能够在不牺牲输出质量或上下文窗口的情况下,更轻松地在高流量任务中大规模运用生成式 AI,甚至在多模态应用场景中也是如此,”市场调研公司 Ipsos 的全球生成式 AI 负责人 JC Escalante 说道,“Gemini Flash 为更好地管理投资回报率创造了机会。”


“作为一家致力于帮助企业营销团队提高工作效率的 AI 优先公司,我们必须利用成本效益出色的优质多模态模型,助力客户快速轻松地创作出精彩内容并重新构想其现有创意资产,”Jasper.ai 的首席战略官 Suhail Nimji 说道,“借助 Gemini 1.5 Pro 和新的 1.5 Flash,我们将继续提升生成式内容的质量标杆,确保遵循品牌风格和营销准则,同时提高全程效率。”



Gemini 1.5 Pro:

业界领先的 200 万 token 上下文窗口


Gemini 1.5 Pro 现已正式发布。它具备业界领先、最高可达 200 万个 token 的上下文窗口,能够解锁其他模型力不能及的独特多模态应用场景。

 

处理仅仅六分钟的视频就需要超过 10 万个 token ,而大型代码库可能超过 100 万个 token - 无论应用场景是查找海量代码中的 bug、在大型研究资料库中搜寻正确的信息,还是分析数以小时计的音频或视频,Gemini 1.5 Pro 的超大上下文窗口都可帮助组织开拓全新领域。



Imagen 3:

更快的图像生成速度、更强的提示理解能力


Imagen 3 是 Google 最新的图像生成基础模型。它在提供卓越图像质量的同时,更在 Imagen 2 基础上做了多项改进:生成速度提高 40% 以上,方便用户快速进行原型设计和迭代,理解提示和遵循指令的能力更强,能够生成逼真的人群图像,并可更精准地控制图像中的文本渲染。


Imagen 3 现推出预览版,供 Vertex AI 客户抢先体验。它可理解多种语言,内置 Google DeepMind 的 SynthID 数字水印等安全功能,还支持多种画面比例。


使用 Google 的最新图像生成模型 Imagen 3 生成的图片


“在早期测试中,Imagen 3 模型在质量和速度方面都给了我们惊喜,”Typeface 的 AI 研究负责人 Gaurav Sharma 说道。这家初创公司专注于利用生成式 AI 进行企业内容创作。“它在细节生成和人类生活图像方面都有显著改进。作为 Google 基础模型的早期试用合作伙伴,我们期待在未来发展道路上进一步探索新的 Imagen 和 Gemini 模型。”


“我们让用户能够利用 AI 的力量,轻松将创意转化为精美的演示文稿、网站和其他可视化文档。为了进一步提升个性化水平和创造力,同时减少手动操作,我们通过 Imagen 提供高质量的文生图功能,”Gamma 的联合创始人 Jon Noronha 说道,“我们的用户已经用 Imagen 生成了超过 400 万张图片。Imagen 3 能够让他们更快地创作图片、在图片中加入文本,并安全地、更好地生成包含人物的逼真图片,这令我们非常期待。”


“自从将 Imagen 加入我们的 AI 图片生成工具后,我们的用户已经使用这个模型生成了数百万张图片。我们非常期待 Imagen 3 承诺的改进,它能让我们的用户更快实现他们的创意,而不必牺牲质量。作为 Shutterstock 推出的首款符合道德来源的 AI 图像生成器的重要增强,我们非常认可的另一点是,它不但内置了安全功能,创作成果也享受 Google Cloud 的生成式 AI 赔偿保障。”Shutterstock 数据服务副总裁 Justin Hiza 说道。



第三方模型和开放模型:

拓宽使用 Vertex AI 时的模型选择面


在 Google Cloud,我们致力于通过 Vertex AI 上精心挑选的自有模型、开放模型和第三方模型,为客户提供更多选择、为创新注入更多动力。因此,我们非常高兴地宣布,Anthropic 新发布的Claude 3.5 Sonnet 模型也已登陆 Vertex AI。客户可以开始使用 Google Cloud 上的 Claude 3.5 Sonnet 模型开展实验或将其部署到生产环境。今年夏末,我们还将在 Vertex AI 的 Model Garden 模型库中新增 Mistral Small、Mistral Large 和 Mistral Codestral 模型,进一步深化与 Mistral 的合作。


秉持立足当下满足客户需求的理念,今年早些时候,我们基于与 Gemini 模型相同的技术和研究成果,推出了一系列轻量级、先进的开放式模型 Gemma。今天,我们正式面向全球的研究人员和开发者发布 Gemma 2。Gemma 2 提供 90 亿(9B)和 270 亿(27B)参数两种规格,相较于第一代更加强大高效,并显著改进了安全性。从下个月开始,客户将可以在 Vertex AI 上使用 Gemma 2。



费用更低:

Gemini 1.5 Pro 和 Flash 都支持上下文缓存


为帮助客户高效利用 Gemini 的超大上下文窗口,从今天开始,我们将逐步为 1.5 Pro 和 Flash 模型推出上下文缓存功能的公开预览版。随着上下文长度的增加,为长上下文应用生成响应变得越来越昂贵且缓慢,提高投产难度。Vertex AI 上下文缓存功能可将常用上下文保存到缓存中,帮助客户显著降低输入成本(减费幅度最高可达 75%)。目前,Google 是市场上唯一一家提供上下文缓存 API 的供应商。



可预测的性能:

为 Gemini 模型预配吞吐量


从今天起,预配吞吐量功能正式面向许可名单上的客户推出。它让客户在使用 Gemini 1.5 Flash 等 Google 自有模型时能够负责任地扩容,在容量和价格上都获得保证。这项 Vertex AI 功能为客户的生产工作负载带来了可预测性和可靠性,使他们能够自信地为生成式 AI 工作负载灵活扩容。



为企业提供可靠信息:

更多接地选择,不但支持 Google 搜索,现更支持第三方数据


要打造适合企业的平台,只有模型还不够。企业需要最大限度地提高准确性并显著减少幻觉,这意味着不但要将模型接地到来自 Web、第一方和第三方的事实信息和数据,还要满足企业在数据治理和数据主权等方面的严格标准。


在 Google I/O 大会上,我们宣布正式推出 Vertex AI 的 Google 搜索接地服务。随着这项服务的正式发布,各类企业现在都可以利用 Google 搜索接地来增强 Gemini 的输出,使模型能够取用最新的优质信息。客户可以轻松将增强后的 Gemini 模型集成到他们的 AI agent 中。


“Gemini 1.5 Flash 为未来更好地管理投资回报率创造了机会。通过模型的 Google 搜索接地功能,我们可以利用最新数据,更好地提升我们的对话式产品 Ipsos Facto 的结果相关性,”Ipsos 的 JC Escalante 说道,“在我们不懈改善输出质量和研究人员体验的道路上,这项功能发挥着不可或缺的关键作用。”


Quora 现在在其 Poe 平台上提供 Google 搜索接地功能,其产品主管 Spencer Chan 说道:“通过 Google 搜索接地意味着我们可以获得更准确、更新鲜、更可靠的答案。用户现在能够更加自信地与 Gemini 聊天机器人互动,他们的积极反馈让我们非常欣喜。”


我们今天还宣布,从下个季度开始,Vertex AI 将提供一项新服务,让客户能够使用专业第三方数据来接地他们的 AI agent。这有助于企业将第三方数据集成到他们的生成式 AI agent,解锁各种独特应用场景,并提高其 AI 产品中的企业信息准确性。我们正与穆迪、MSCI、汤森路透 Zoominfo 等知名供应商合作,将他们的数据引入这项服务。


“Google Cloud 的第三方数据接地服务将为毕马威和我们的客户开启全新应用场景,”毕马威全球税务与法务部门首席技术官 Brad Brown 说道,“通过将行业领军供应商的专业第三方数据无缝集成到我们的生成式 AI 产品中,我们能够利用高度可信的数据源来减少数据分析时间、推动更明智的决策,并最终实现更丰硕的价值。”



更准确的回答:

高保真模式接地


在金融服务、医疗保健和保险等数据密集型行业中,生成式 AI 应用场景通常要求生成的响应只依据所提供的上下文,而不是模型的宽泛知识。高保真接地功能现发布实验预览版,可针对性地满足这类接地场景需求,包括总结多个文档、从一组金融数据集中提取数据或处理给定的一套文档。高保真模式由一个经过专门微调的 Gemini 1.5 Flash 版本驱动,它只使用客户提供的内容生成回答,可确保响应的高准确性。



保障数据主权的理想选择:

选择静态数据驻留位置,限制机器学习处理区域


很多客户,尤其是受监管行业的客户,要求在使用生成式 AI 功能的过程中能够控制其数据的存储和处理位置。为了满足这类数据主权要求,我们在 23 个国家/地区提供静态数据驻留位置保证(其中 13 个国家/地区是 2024 年新增的:西班牙、意大利、以色列、瑞士、波兰、芬兰、巴西、印度、中国台湾、中国香港、澳大利亚、沙特阿拉伯、卡塔尔),并在美国和欧盟提供对相关机器学习处理位置的额外保证。我们正在努力将机器学习处理保证拓展到另外 8 个国家/地区,其中 4 个国家/地区将在 2024 年内得到支持。



立即开始使用 Vertex AI


正如我们今天分享的客户案例所展示的那样,Vertex AI 可帮助企业将生成式 AI 的强大能力转化为实实在在的变革性成果。我们期待继续为客户带来 Gemini 1.5 Flash 和 Google 搜索接地这样的创新,并努力将 Vertex AI 打造成完美满足企业需求的生成式 AI 平台。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅