SDXL Turbo：一种实时文本到图像生成模型

AI前沿3年前发布 wanglu852

SDXL Turbo：一种实时文本到图像生成模型

主要内容

SDXL Turbo通过一种新的蒸馏技术实现了最先进的性能，使得图像生成只需一步即可达到前所未有的质量，将所需步骤从50步减少到只需一步。
SDXL Turbo采用了一种名为Adversarial Diffusion Distillation (ADD)的新蒸馏技术，使模型能够在单一步骤中合成图像输出，并在保持高采样保真度的同时生成实时文本到图像的输出。
SDXL Turbo的研究论文详细介绍了该模型的新蒸馏技术，该技术结合了对抗训练和分数蒸馏。

Adversarial Diffusion Distillation的优势

SDXL Turbo在扩散模型技术方面进行了新的改进，基于SDXL 1.0的基础上实现了一种新的文本到图像模型的蒸馏技术：Adversarial Diffusion Distillation。
通过采用ADD，SDXL Turbo获得了与生成对抗网络（GANs）类似的许多优势，如单步图像输出，同时避免了其他蒸馏方法中常见的伪影或模糊现象。
SDXL Turbo的研究论文详细介绍了该模型的新蒸馏技术。

与其他扩散模型相比的性能优势

为了选择SDXL Turbo，我们通过使用相同的提示生成多个不同的模型变体（StyleGAN-T ++，OpenMUSE，IF-XL，SDXL和LCM-XL）来进行比较。
然后，向人工评估员展示两个随机输出，并要求他们选择最接近提示方向的输出。
接下来，使用相同的方法对图像质量进行了额外的测试。
在这些盲测中，SDXL Turbo能够以单一步骤击败4步配置的LCM-XL，并且只需4步就能击败50步配置的SDXL。
通过这些结果，我们可以看到SDXL Turbo在不牺牲图像质量的情况下，以更低的计算要求超越了最先进的多步模型。

SDXL Turbo的推断速度改进

在A100上，SDXL Turbo在207毫秒内生成一个512×512的图像（包括提示编码+单一去噪步骤+解码，fp16），其中67毫秒由单个UNet前向评估所占据。

使用Clipdrop探索SDXL Turbo

要测试这个新模型的能力，请访问Stability AI的图像编辑平台Clipdrop，体验SDXL Turbo的实时图像生成的Beta演示。
Clipdrop与大多数浏览器兼容，目前可以免费试用。

商业应用

如果您希望将此模型用于商业产品或目的，请通过此处联系我们以了解更多信息。

联系方式和订阅

您可以通过订阅我们的新闻通讯、关注我们的Twitter、Instagram、LinkedIn，以及加入我们的Discord社区来了解我们的进展。

公司信息

Stability AI是一家人工智能公司，提供稳定性AI解决方案。
公司提供API平台和开发者文档，以及企业级解决方案。
公司的合作伙伴包括研究机构和其他企业。
公司提供关于API平台和企业的详细信息，包括定价和联系方式。

其他信息

公司提供日本语言支持。
公司提供联系方式，包括电子邮件和社交媒体。
公司还提供法律信息，包括可接受的使用政策、隐私政策和使用条款。

来源：Introducing SDXL Turbo: A Real-Time Text-to-Image Generation Model — Stability AI

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Easy Voice Toolkit：AI语音工具箱的全面解析

Easy Voice Toolkit：AI语音工具箱的全面解析

2年前

34,5260

Midjourney Patchwork：一句话构建你的专属世界？

Midjourney Patchwork：一句话构建你的专属世界？

AI前沿 # AI创作 # MidJourney # Patchwork

2年前

25,5860

OpenAI SearchGPT 内测：引领更智能的人性化搜索体验

OpenAI SearchGPT 内测：引领更智能的人性化搜索体验

AI前沿 # openai # SearchGPT

2年前

25,3350

如何用思维链写一个好的提示词，让Cursor帮我们写出更好的代码？

如何用思维链写一个好的提示词，让Cursor帮我们写出更好的代码？

1年前

139,9150

error: Content is protected !!