微信扫码
添加专属顾问
我要投稿
著名大模型开源平台Stability AI,开源了超强文生图模型——Stable Diffusion 3.5。
Stable Diffusion 3.5一共有Large、Large Turbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。
开源地址:https://huggingface.co/stabilityai
Github:https://github.com/Stability-AI/sd3.5
今年6月Stability AI首次开源了Stable Diffusion 3 Medium,但效果未达到预期,在听取了社区用户的反馈后,Stability AI花费大量时间进一步开发,便有了最新的3.5版本。
Large、Turbo、Medium简单介绍
在这次发布中,Stable Diffusion 3.5提供了多种模型,以满足不同用户群体的需求。Stable Diffusion 3.5 Large模型拥有80亿参数,提供了卓越的图片质量和高度文本语义还原,是Stable Diffusion家族中最强大的模型,非常适合专业使用,尤其是在100万像素分辨率的图片。
而Stable Diffusion 3.5 Large Turbo模型则是一个蒸馏版本,它能够在仅仅4步之内生成高质量的图像,并且对提示的遵循性非常好,速度比Stable Diffusion 3.5 Large快得多。
Stable Diffusion 3.5 Medium模型将在10月29日发布,这个模型有25亿参数,采用了改进的MMDiT-X架构和训练方法,能在消费级硬件上即开即用,可生成0.25—200万像素之间生成图像,兼顾了质量和易定制性。
在开发这些模型的过程中,Stability AI优先考虑了可定制性,提供了一个灵活的基础来构建。
将Query-Key归一化集成到了变换器块中,这不仅稳定了模型训练过程,还简化了进一步的微调和开发。
为了支持这种下游的灵活性,Stability AI不得不做出一些权衡,例如,同一个提示使用不同种子可能会产生更大的输出变化,这是有意为之的,以帮助在基础模型中保留更广泛的知识库和多样化的风格。
此外,Stable Diffusion 3.5在可定制性、高效的性能以及多样化的输出方面表现出色,使其成为市场上最可定制和最易访问的文生图像模型之一,同时在提示遵循性和图像质量方面保持了顶级性能。
本文素材来源Stability AI,如有侵权请联系删除
END
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-09
为 ONLYOFFICE AI 智能体开发自定义函数:实践指南&夺奖攻略!
2025-09-09
开源智能体开发框架全面对比分析
2025-09-09
Dify Pre-release版本来了,Dify2.0时代不远了,看看有哪些进步?
2025-09-09
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
2025-09-08
微信公众号“内容孤岛”终结者:免费开源工具,批量下载+完美还原!
2025-09-08
Claude不让用,有哪些国产模型能迎头赶上?
2025-09-08
前豆包大模型市场负责人创业,GEO服务商「PureblueAI清蓝」获千万级种子轮融资 丨涌现新项目
2025-09-08
神秘模型上线,极有可能是Gemini 3,附详细配置使用指南
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-09-07
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-09-09
2025-09-08
2025-09-07
2025-09-01
2025-08-16
2025-08-13
2025-08-11
2025-08-11