SDXL Turbo:一种实时文本到图像生成模型

AI前沿8个月前发布 wanglu852
11,710 0 0
广告也精彩

SDXL Turbo:一种实时文本到图像生成模型

主要内容

  • SDXL Turbo通过一种新的蒸馏技术实现了最先进的性能,使得图像生成只需一步即可达到前所未有的质量,将所需步骤从50步减少到只需一步。
  • SDXL Turbo采用了一种名为Adversarial Diffusion Distillation (ADD)的新蒸馏技术,使模型能够在单一步骤中合成图像输出,并在保持高采样保真度的同时生成实时文本到图像的输出。
  • SDXL Turbo的研究论文详细介绍了该模型的新蒸馏技术,该技术结合了对抗训练和分数蒸馏。

Adversarial Diffusion Distillation的优势

  • SDXL Turbo在扩散模型技术方面进行了新的改进,基于SDXL 1.0的基础上实现了一种新的文本到图像模型的蒸馏技术:Adversarial Diffusion Distillation。
  • 通过采用ADD,SDXL Turbo获得了与生成对抗网络(GANs)类似的许多优势,如单步图像输出,同时避免了其他蒸馏方法中常见的伪影或模糊现象。
  • SDXL Turbo的研究论文详细介绍了该模型的新蒸馏技术。

与其他扩散模型相比的性能优势

  • 为了选择SDXL Turbo,我们通过使用相同的提示生成多个不同的模型变体(StyleGAN-T ++,OpenMUSE,IF-XL,SDXL和LCM-XL)来进行比较。
  • 然后,向人工评估员展示两个随机输出,并要求他们选择最接近提示方向的输出。
  • 接下来,使用相同的方法对图像质量进行了额外的测试。
  • 在这些盲测中,SDXL Turbo能够以单一步骤击败4步配置的LCM-XL,并且只需4步就能击败50步配置的SDXL。
  • 通过这些结果,我们可以看到SDXL Turbo在不牺牲图像质量的情况下,以更低的计算要求超越了最先进的多步模型。

SDXL Turbo的推断速度改进

  • 在A100上,SDXL Turbo在207毫秒内生成一个512×512的图像(包括提示编码+单一去噪步骤+解码,fp16),其中67毫秒由单个UNet前向评估所占据。

使用Clipdrop探索SDXL Turbo

  • 要测试这个新模型的能力,请访问Stability AI的图像编辑平台Clipdrop,体验SDXL Turbo的实时图像生成的Beta演示。
  • Clipdrop与大多数浏览器兼容,目前可以免费试用。

商业应用

  • 如果您希望将此模型用于商业产品或目的,请通过此处联系我们以了解更多信息。

联系方式和订阅

  • 您可以通过订阅我们的新闻通讯、关注我们的Twitter、Instagram、LinkedIn,以及加入我们的Discord社区来了解我们的进展。

公司信息

  • Stability AI是一家人工智能公司,提供稳定性AI解决方案。
  • 公司提供API平台和开发者文档,以及企业级解决方案。
  • 公司的合作伙伴包括研究机构和其他企业。
  • 公司提供关于API平台和企业的详细信息,包括定价和联系方式。

其他信息

  • 公司提供日本语言支持。
  • 公司提供联系方式,包括电子邮件和社交媒体。
  • 公司还提供法律信息,包括可接受的使用政策、隐私政策和使用条款。

来源:Introducing SDXL Turbo: A Real-Time Text-to-Image Generation Model — Stability AI

© 版权声明
chatgpt4.0

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...
error: Content is protected !!