微信扫码
添加专属顾问
我要投稿
Google AI Studio 带来视频和图片生成新体验,中文支持待提升。 核心内容: 1. AI Studio 新增多媒体生成功能:Veo2 和 Imagen 3.0 2. 支持多种生成方式:文字生成图片、视频等 3. 官方提供示例和提示词,优化中文体验
Google AI Studio 最近悄然新增了多媒体生成功能的支持,包括 Veo 2 用于生成视频,以及 Imagen 3.0 用于生成图片。这些功能涵盖了多种生成方式,如文字生成图片、文字生成视频,以及通过参考图片生成视频。
体验入口已经开放,用户可以通过以下链接尝试:https://aistudio.google.com/gen-media
官方还贴心地提供了多种风格的示例,供用户参考和使用
更多提示词:https://qianniucity.feishu.cn/wiki/JUMBwXdIiiZD8ck8LhxcwOz3n7d?from=from_copylink
用户可以输入提示词来生成所需的图片。例如:
The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone
{
"task": "Generate Product Description and Image Spec",
"product_name": "Handmade Ceramic Mug",
"key_selling_points": ["Unique Glaze Finish", "Ergonomic Handle", "Microwave Safe"],
"target_customer": "Artisan craft lovers",
"text_description_spec": {
"length": "Approx. 150 words",
"tone": "Warm and Craftsmanship-focused",
"structure": ["Highlight uniqueness", "Mention practicality", "Suggest usage scenarios"]
},
"image_spec": {
"number_of_images": 2,
"image_1": {
"subject": "The mug from the side, showing the glaze texture",
"style": "Natural lighting, focus on detail, soft background"
},
"image_2": {
"subject": "The mug being held, showing scale and handle feel",
"style": "Lifestyle shot, warm atmosphere"
}
}
}视频生成支持文字生成视频,以及通过参考图片生成视频。用的是最新的 Veo 2 的模型,支持 16:9 的横屏和竖屏比例, 它最长支持 8 秒的视频生成。
Create a video with an image: a cute creature with snow leopard-like fur is walking in a winter forest.
⚠️需要注意的是,目前文生图对中文的支持还不够理想,常见的处理方式是将中文提示词转换成英文。
比如相同的提示词
英文:The picture style is a food shoot. A pile of blueberries fall into the water and slowly sink. The fruits are surrounded by blisters and have a leaf on them, creating an appetizing color tone
中文:图片风格为美食拍摄,一堆蓝莓掉入水中,慢慢沉入水中,水果周围都是水泡,带一片叶子,让人开胃的色调 此外,对于 Veo 2 的视频生成功能,用户在 AI Studio 中可以享受有限的免费测试配额。如果需要生成超出免费限额的视频,或将 Veo 2 集成到自己的项目中,可以通过 Gemini API 实现。(Imagen 3.0 的文生成图也一样)
Google 最近推出的一系列新功能,无论是编程还是多媒体生成,对创作者或者开发者来说,都充满了吸引力。赶紧用起来吧!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-27
一个神奇的视频生成 Skills,实测,狂喜
2026-04-26
你的一人公司品牌部,带着Image-2模型的lovart中文版来了
2026-04-22
MNN-Sana-Edit-V2:端侧运行的图像漫画风编辑大模型
2026-04-22
刚刚!Codex 居然能直接画图了,OpenAI 凌晨甩出 Image 2.0
2026-04-21
PaddleOCR 3.5 发布:Web 端直用、文档一键转 Markdown,生态交互新体验
2026-04-21
用Claude Code剪视频,自动去口癖、加字幕、调色,完全免费开源
2026-04-15
刚刚,李飞飞最新成果发布,手机也能跑亿级粒子的 3D 世界了|附体验地址
2026-04-09
豆包「打电话」升级 Seeduplex:周围再吵,只认准你的声音
2026-04-22
2026-04-01
2026-03-05
2026-02-12
2026-02-27
2026-02-12
2026-03-11
2026-04-02
2026-03-18
2026-02-10
2026-03-12
2025-12-31
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30