首页 - 学术科研 - 神经网络 - 数据挖掘

SDXL 1.0出图效果直逼Midjourney！手把手教你快速体验！

2024-01-23 03:19:19 苏内容

标签： AI

阅读：3752

介绍

最近，Stability AI正式推出了全新的SDXL 1.0版本。经过我的实际测试，与之前的1.5版本相比，XL的效果有了巨大的提升，可以说是全方位的超越。不仅在理解提示词方面表现出色，而且图片的构图、颜色渲染和画面细腻程度都有了很大的进步，实际出图效果堪比Midjourney。此外，该版本还继续采用开源的形式发布，对于喜欢自定义生成图片的用户来说是一个极大的福音。

在 SD WebUI上运行时还有一个额外的惊喜，就是它直接支持绘制不同风格的图片，如下图所示：

图片来源：https://stable-diffusion-art.com/sdxl-model/#Using_SDXL_style_selector

看到这里，我想一些大模型、Lora模型确实可以进入回收站了。

那么XL现在是怎么做的呢？相比之前的出图方式，SDXL采用了两步走的方法，先使用基本模型生成有噪声的潜在图，然后再使用精修模型进行降噪优化，官方给的处理示意图如下：

不过基本模型也是可以独立使用的。所以实际出图时也可以采用另一种方法，首先，使用基本模型生成所需输出大小的潜在图；然后通过图生图的方式，使用精修模型和相同的提示词，重绘第一步生成的潜在图，以优化出图效果。这种方法稍微慢一些，因为它要执行更多的处理。

实际使用时，需要注意以下几点：

负面提示：与1.5、2.0版本相比，负面提示不再像之前那么必要了。许多常见的负面词汇是无用的，比如“Extra fingers”。
关键词权重：对于SDXL模型来说，1.5版本的权重很高。如果你要复用1.5模型的提示，可能需要降低权重。减少权重的效果比增加权重更好。
安全扩散：一定要使用safetensor版本的模型，它更安全，不会在你的机器上执行代码。
精修强度：为了获得最佳输出效果，请使用低强度的refiner。
Refiner：为了得到更好的效果，请使用一张有噪声的图片来使用refiner。
图像大小：SDXL模型的原生大小是1024×1024像素。虽然SDXL支持不同的宽高比，但图像质量对大小很敏感。以下是Stability AI官方图像生成器的尺寸，建议采用，如果需要更大尺寸的照片，可以再使用高清化放大。

21:9 – 1536 x 640
16:9 – 1344 x 768
3:2 – 1216 x 832
5:4 – 1152 x 896
1:1 – 1024 x 1024

ControlNet：ControlNet现在只能在V1模型上工作，SDXL的支持还在开发中。

免安装体验

不用安装，还有N多的模型可以直接使用，不仅能使用SD XL，也可以继续使用SD 1.5；缺点是不能安装插件。

访问地址：https://www.liblibai.com/

进入后，点击页面右上角的“在线Stable Diffusion”即可进入。

按照下边的步骤操作即可。

注意第3步和第4步，这是和之前不一样的地方。

需要勾选XL Refiner才有精修，大家可以对比下勾和不勾的效果。
选择SDXL的模型后，宽度和高度默认变成 1024*1024。

分享下提示词：

提示词：street fashion photography, young female, pale skin, (look at viewer), sexy pose,(pink hair, white hair, blonde hair, long hair), ((high ponytail)),detailed skin, (detailed eyes:1.3), skin pores, (grin:1.1), skin texture, (Hunter green uniform, black skirt:1.4), long green sleeves,8k, real picture, intricate details, ultra-detailed,(photorealistic),film action shot, full body shot, in a shopping mall,realistic, extremely high quality RAW photograph, detailed background, intricate, warm lighting, high resolution,uhd, film grain, Fujifilm XT3

反向提示词：text, watermark, disfigured, kitsch, ugly, oversaturated, low-res, blurred, painting, illustration, drawing, sketch, low quality, long exposure, (cape:1.4), cartoon, 3d character

然后大家就可以愉快的生图了，每天300张。不过因为是共享的服务，高峰期可能等待的时间比较长。