(资料图片)
Stability AI 近日发布了 Stable Diffusion XL 0.9,这是 Stable Diffusion 文本-图像模型套件中最先进的开发成果。继 4 月发布 Stable Diffusion XL Beta 之后,Stable Diffusion XL 0.9 在图像和构图细节方面比前者有了巨大的改进。
示例
在 SDXL Beta 版(左)和 0.9 版上测试的一些 prompt 例子显示了这个模型在短短两个月内取得了多大进展。
变化
SDXL 系列还提供了一系列超越基本文本提示的功能。这些功能包括输入一个图像以获得该图像的变化、重建图像的缺失部分和构建一个现有图像的无缝扩展。
SDXL 0.9 在构图上的这一进步的关键驱动力是它的参数数(模型所训练的神经网络中所有权重和偏差的总和)比测试版大幅增加。
SDXL 0.9 是所有开源图像模型中参数数量最多的一个,它拥有一个 35 亿的参数基础模型和一个 66 亿的参数模型集合管道(最终输出是通过在两个模型上运行并汇总结果而产生的)。管道的第二阶段模型被用来为第一阶段生成的输出添加更精细的细节。
作为对比,两个月前发布的测试版只在 31 亿参数的单个模型上运行。
系统要求
尽管 SDXL 0.9 具有强大的输出和先进的模型架构,但它能够在现代消费级 GPU 上运行,其所需的系统配置为 Windows 10/11 或 Linux 操作系统、配备 16GB 内存、至少 8GB 的 VRAM 的 Nvidia GeForce RTX 20 显卡(同等或更高标准),Linux 用户也能够使用 16GB VRAM 的兼容 AMD 显卡。
统计数据
自从 SDXL 的测试版于 4 月推出以来,Discord 社区的用户数量达到了近 7000 人,反应非常好。这些用户已经生成了 70 多万张图片,平均每天超过 2 万张。
规划
SDXL 0.9 之后,将于 7 月中旬全面公开发布 SDXL 1.0
更多详情可查看:https://stability.ai/blog/sdxl-09-stable-diffusion