微信扫码
添加专属顾问
我要投稿
Google Veo 3.1震撼发布,视频生成自带音频,三大新功能让创意无限延伸! 核心内容: 1. Veo 3.1支持720p/1080p视频生成,自带同步音频 2. 三大创新功能:视频扩展、首尾帧补间、图片引导风格控制 3. 当前使用限制与优化:API调用、生成速度、内容安全机制
大半夜的, Google 把 Veo 3.1 发了
和 Sora 一样,生成的视频,也都自带声音
能生成 720p 和 1080p 的 8 秒视频
在内容质量质量、物理效果、真实性和提示词遵循方面,都很表现卓越
声音与内容,也结合的很好
并且充满创意
除此之外,本次升级,还带来了三项功能:
这东西,可以通过 Gemini API 直接调用
也可以在 https://aistudio.google.com/ 中使用
但在这之前,你需要先 setup 一个付费账户
https://console.cloud.google.com/billing/create
视频扩展
假如之前生成了一段滑翔伞起飞的视频,8秒结束了
现在可以直接接着做: "让滑翔伞缓慢下降"
模型会从上一段的最后1秒(24帧)开始,继续生成
首尾帧
给两张图,前一张: 姜黄色猫咪开红色敞篷车,在法国里维埃拉海岸
后一张: 车从悬崖上起飞
中间的过程,模型自己补
图片引导
最多上传3张参考图,可以是:
模型会在生成的视频里保持这些元素的外观
举个例子,先上传一条深海安康鱼
再来一套粉色公主裙
提示词写「制作一个搞笑卡通版的鱼,穿着服装游泳并挥舞魔杖」
出来的就是: 安康鱼穿着公主裙的动画
只有API: 目前你只可以通过 API(或者 AI Studio)来访问
生成速度: 最快11秒,高峰时可能要6分钟
视频保留: 生成的视频在服务器上只存2天,要下载就趁早
安全过滤: 所有视频都会过滤,违规的提示词直接被拦,生成的视频自带 SynthID 水印(Google 的AI内容标识)
音频问题: 有时候安全过滤会阻止视频生成,但不收费
Veo 3.1 这次把原生音频、扩展、帧控制这几个能力打包,速率限制也优化了
让我们把目光转向 OpenAI,看他们接下来怎么发
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-21
编程选GPT-5.4,还是GPT-5.3-Codex?
2026-03-21
AI Coding前端实践后的复盘总结
2026-03-21
OpenAI 首席科学家:Codex 只是雏形,我们要造的是「全自动 AI 研究员」
2026-03-21
谷歌Stitch「氛围设计」干崩Figma 8.8%股价:十年经验,败给巨头一次更新(附实测)
2026-03-21
为什么 CLI 比 MCP 更适合 LLM
2026-03-21
渐进式披露(Progressive Disclosure):Agent 从 Demo 到企业级落地的 “救命架构”
2026-03-21
AI 编程工具怎么选?Codex 和 Claude Code 的本质区别
2026-03-21
Karpathy 最新播客:我得了 AI 精神病、App 将消失、Agent 将碾压实验室
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-01-09
2026-01-09
2026-01-23
2025-12-30
2026-01-14
2026-01-21
2026-03-21
2026-03-20
2026-03-19
2026-03-19
2026-03-19
2026-03-18
2026-03-17
2026-03-17