免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


谷歌 Nano Banana 2 要来了,多步自检流程是亮点

发布日期:2025-11-09 10:54:07 浏览次数: 1533
作者:AI工程化

微信搜一搜,关注“AI工程化”

推荐语

谷歌Nano Banana 2即将发布,多步自检流程带来图像生成质的飞跃,创意工作者的新利器。

核心内容:
1. Nano Banana 2针对初代痛点进行针对性优化,视觉质量显著提升
2. 创新性多步自检流程实现高精度图像生成,支持多种宽高比和分辨率
3. 预计11月发布,或将改变消费级和专业级创意工具格局

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

Nano Banana 2 近期意外地在 Media AI 平台上短暂现身。其输出结果与之前在 Gemini 上短暂泄漏的确认版本一致,让社区用户得以提前体验新版本的能力。

针对性改进

初代 Nano Banana 在处理复杂任务时存在明显局限:精确着色、视角控制、修正生成图片中的文字元素都不够理想。Nano Banana 2 专门针对这些痛点做了优化,泄漏的图像样本显示视觉质量有了实质性提升。

核心技术变化

最大的改进是生成流程。新版本采用多步工作方式:花时间规划输出,生成图像后通过内置图像分析功能进行"自检",识别并修正错误,必要时迭代,最后交给用户。这种迭代修正循环在之前版本中没见过,对需要高精度图像的用户特别有用。

内部观察显示,它目前仍基于 Gemini 2.5 Flash,而非完全转向 Gemini 3.0 Pro。这可能意味着更早的发布窗口,后续再升级到新的基础模型。

功能扩展和性能提升

内部测试和 GitHub 提交记录显示,新版本被重新命名为"Nano Banana Pro",指令遵循的准确性和一致性比早期 Nano Banana 2 构建版高出三倍。在图像"撕碎"后重建等压力测试中,模型能在新会话中保持输出一致性。

功能更新包括扩展的宽高比支持(1:1, 2:3, 3:2, 3:4, 4:3, 9:16, 16:9, 21:9)和更广的输出分辨率范围(1K, 2K, 4K 模式)。

(来源:@legit_api)

对比效果

社区用户分享的对比图显示,Nano Banana 2 在细节处理和指令理解上有明显提升。

Nano Banana 2 vs Nano Banana 1(来源:@Azinha810)

更多对比样本(来源:@synthwavedd)

Nano Banana 2 生成样本(来源:@Angaisb_)

"让水变成粉色":原图 - Nano Banana 1 - Nano Banana 2(来源:@BrentLynch)

风格参考对比:Nano Banana 1 vs Nano Banana 2

发布计划

根据泄漏信息,Nano Banana 2 可能在 11 月 11 日正式发布。社区讨论焦点是该产品(内部代号 GEMPIX 2)究竟基于 Imagen 4 构建,还是继续使用 Gemini 3 Pro 或 Flash。还有传言提到多个产品变体,包括可能支持高分辨率的 Nano Banana Pro,但这些都未得到官方证实。

内部测试已在推进,Gemini 用户界面中出现了发布预告卡片,通常意味着几天内就会公开推送。GEMPIX 2 不会仅限于 Gemini 应用,还将扩展到 Whisk 实验室等其他实验项目。

对创意专业人士、产品设计师和技术爱好者来说,这次更新意味着更广泛的创意控制和更高的输出保真度,可能会改变消费级和专业级环境下的工作流程。

关注公众号回复“进群”入群讨论。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询