SDXL Turbo:一种实时文本到图像生成模型
主要内容
- SDXL Turbo通过一种新的蒸馏技术实现了最先进的性能,使得图像生成只需一步即可达到前所未有的质量,将所需步骤从50步减少到只需一步。
- SDXL Turbo采用了一种名为Adversarial Diffusion Distillation (ADD)的新蒸馏技术,使模型能够在单一步骤中合成图像输出,并在保持高采样保真度的同时生成实时文本到图像的输出。
- SDXL Turbo的研究论文详细介绍了该模型的新蒸馏技术,该技术结合了对抗训练和分数蒸馏。
Adversarial Diffusion Distillation的优势
- SDXL Turbo在扩散模型技术方面进行了新的改进,基于SDXL 1.0的基础上实现了一种新的文本到图像模型的蒸馏技术:Adversarial Diffusion Distillation。
- 通过采用ADD,SDXL Turbo获得了与生成对抗网络(GANs)类似的许多优势,如单步图像输出,同时避免了其他蒸馏方法中常见的伪影或模糊现象。
- SDXL Turbo的研究论文详细介绍了该模型的新蒸馏技术。
与其他扩散模型相比的性能优势
- 为了选择SDXL Turbo,我们通过使用相同的提示生成多个不同的模型变体(StyleGAN-T ++,OpenMUSE,IF-XL,SDXL和LCM-XL)来进行比较。
- 然后,向人工评估员展示两个随机输出,并要求他们选择最接近提示方向的输出。
- 接下来,使用相同的方法对图像质量进行了额外的测试。
- 在这些盲测中,SDXL Turbo能够以单一步骤击败4步配置的LCM-XL,并且只需4步就能击败50步配置的SDXL。
- 通过这些结果,我们可以看到SDXL Turbo在不牺牲图像质量的情况下,以更低的计算要求超越了最先进的多步模型。
SDXL Turbo的推断速度改进
- 在A100上,SDXL Turbo在207毫秒内生成一个512×512的图像(包括提示编码+单一去噪步骤+解码,fp16),其中67毫秒由单个UNet前向评估所占据。
使用Clipdrop探索SDXL Turbo
- 要测试这个新模型的能力,请访问Stability AI的图像编辑平台Clipdrop,体验SDXL Turbo的实时图像生成的Beta演示。
- Clipdrop与大多数浏览器兼容,目前可以免费试用。
商业应用
- 如果您希望将此模型用于商业产品或目的,请通过此处联系我们以了解更多信息。
联系方式和订阅
- 您可以通过订阅我们的新闻通讯、关注我们的Twitter、Instagram、LinkedIn,以及加入我们的Discord社区来了解我们的进展。
公司信息
- Stability AI是一家人工智能公司,提供稳定性AI解决方案。
- 公司提供API平台和开发者文档,以及企业级解决方案。
- 公司的合作伙伴包括研究机构和其他企业。
- 公司提供关于API平台和企业的详细信息,包括定价和联系方式。
其他信息
- 公司提供日本语言支持。
- 公司提供联系方式,包括电子邮件和社交媒体。
- 公司还提供法律信息,包括可接受的使用政策、隐私政策和使用条款。
来源:Introducing SDXL Turbo: A Real-Time Text-to-Image Generation Model — Stability AI
© 版权声明
文章版权归作者所有,未经允许请勿转载。