Stable Diffusion教程-三种放大算法详解!

SD入门教程8个月前更新 wanglu852
36,235 0 0
广告也精彩

简介

在本期教程中,我们将开始一个新的系列,即老照片修复系列。这是老照片修复系列的第一集,我们将介绍老照片修复中最基本的知识,即图片的放大。老照片修复是一个非常有需求的领域,大家可以在某宝上搜索一下,就知道有多大需求了。我们学习 Stable Diffusion 的最终目的是要应用到实战中,也就是利用这项技术来赚钱。所以我之前推出了电商换装三部曲的教程,现在又推出了老照片修复的教程,都是为了探索 Stable Diffusion 在实战项目中的应用可能性。

Stable Diffusion 的放大功能

在 Stable Diffusion 中,有三个地方可以实现图片的放大。
– 第一个是在文生图中,我们可以勾选高分辨率修复选项,然后选择不同的高清算法和放大倍率来实现放大。
– 第二个地方是在图生图中,我们可以选择 SD 放大模式的脚本,然后通过调整参数来实现放大。
– 第三个地方是在后期处理选项卡中,我们可以上传图片并调整缩放比例和算法来实现放大。
Stable Diffusion教程-三种放大算法详解!

放大算法的比较

这节课我们主要对比一下不同的放大算法的效果,看看它们生成的放大图片效果如何。我们将使用 XYZ 脚本来对比真人图片和卡通图片的放大效果。在放大过程中,我们将使用不同的算法,并对比它们的效果。

实际操作演示

我们先生成一张写实风格的图片,然后再生成一张二次元风格的图片。接下来,我们使用 XYZ 脚本分别对这两张图片进行放大,并使用不同的算法。最后,我们比较不同算法放大后的效果。
Stable Diffusion教程-三种放大算法详解!

生成网格图

我们会画出一张9×2的网格图,其中X轴代表不同的放大算法,Y轴代表不同的模型,包括animal2模型和china max模型。

Stable Diffusion教程-三种放大算法详解!

放大算法对比

我们先来看前两个算法,lanczos算法和nearest的最临近点差值算法。虽然这两个算法在实际测试中速度最快,但放大后的效果并不好,特别是nearest算法,放大后的图片无论是二次元还是真人图片都有明显的像素颗粒感。
Stable Diffusion教程-三种放大算法详解!

接下来是ESRGAN算法、RESRGAN算法和RESRGAN+Anime6B算法。这三个算法对二次元图片的放大效果都还可以,尤其是ESRGAN算法在眼部、宝石和发烧部位稍微有一些失真,而RESRGAN和Anime6B算法对细节做了很好的重绘。如果是二次元风格的图片放大,建议使用R-ESRGAN 4x+Anime6B算法。
Stable Diffusion教程-三种放大算法详解!

对于真人图片,ESRGAN算法在细节上比前面的算法更好,特别是头发的细节。但是RESRGAN和R-ESRGAN 4x+Anime6B(尤其是这个模型)算法在放大真人图片时给图片加了一层手绘滤镜,特别是眉毛、睫毛和头发的部分。
Stable Diffusion教程-三种放大算法详解!

如果喜欢真人转手绘风格,可以考虑使用R-ESRGAN 4x+Anime6B算法。如果只是单纯放大真人图片,推荐使用ESRGAN算法。

LDSR算法

LDSR算法在放大时计算时间最长,需要单独下载文件。不论是动漫还是真人图片,放大效果都还可以。通过该算法放大的宝石、耳钉和头发细节都做了精细的重绘。但是使用LDSR算法放大图像后可能会有一定程度的偏黄,可以通过后期调整白平衡来修复。
Stable Diffusion教程-三种放大算法详解!

最后三种算法

前两种算法不论是放大二次元还是真人图片,都有一种淡淡的朦胧感。最后一种算法在放大二次元图片时效果还不错,但在放大真人图片时也有一种淡淡的滤镜感觉。这三种算法更侧重于图片的降噪,对于有噪点的图片,这三个算法的降噪效果比前面的算法好很多。
Stable Diffusion教程-三种放大算法详解!

总结和建议

如果时间充裕且有能力修复色差,优先考虑LDSR算法。其次,对于二次元图片的放大,R-ESRGAN和R-ESRGAN 4x+Anime6B算法效果都不错。对于真人图片的放大,可以尝试ESRGAN和最后一种swinlR算法,会得到相对不错的结果。

如果使用Stable Diffusion的高清化进行图片放大,可以同时选择两种算法配合使用,以达到更好的放大效果。
Stable Diffusion教程-三种放大算法详解!

© 版权声明
chatgpt4.0

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...
error: Content is protected !!