🎙️ AI画图显卡买哪款?1xxx-12999元共17块显卡Stable Diffusion绘图性能横向测评
AI绘图性能测试
毫无疑问,AI是今年最火热的领域之一。无论是CHATGPT还是Stable Diffusion,或许都将成为改变大家未来的起点。从RTX40系显卡开始,我们的测试中就加入了Stable Diffusion AI绘画性能的测试。如今Stable Diffusion能实现的功能越来越多,国内社区的发展也是越来越成熟。国内模型作者带来的底模和Lora等数量也是越发丰富。我们也可以更全面的分析不同显卡在不同工况下的AI绘图性能对比。这次我们给大家带来了从RTX 2060 Super到RTX 4090一共17款显卡的Stable Diffusion AI绘图性能测试。
测试结果
很多小伙伴都说想看魔改22G的2080Ti和魔改16G的3070的表现,但是由于我们家境贫寒,没有预算买这么昂贵的显卡,所以暂时没法加入测试。关于魔改卡的看法和建议也放到了视频后面。由于目前SDXL还不够成熟,模型数量和插件支持也较少,所以依旧使用SD1.5进行测试,使用赛博大神秋叶最新版整合包。模拟了3种应用场景,我们也是一边学习AI绘图一边测试,如有操作不当,还望各位大佬指正。
第一个测试:生成768*768大小的图片
第一个测试来自英伟达测试指南提供的一个模型和提示词,生成768*768大小的图片。这个测试压力相对比较小,不但没有Lora,甚至连反向提示词都没有。从测试结果来看,4090毫无疑问的第一,每分钟可以生成19.73张图,也就是差不多3秒一张。出图速度是上代旗舰3090Ti的差不多1.76倍。3090Ti甚至没有跑过4080,4070Ti则是勉强跑赢了3090,4070介于3080Ti和3080之间。在这17张显卡中没想到成绩最差的是3060,基本上只能和2060Super差不多。当然,4060也没好到哪里去。显卡的FP16半精度性能对Stable Diffusion的出图速度影响很大,所以我们可以看到这个排名和这些显卡的理论半精度性能排名大致是一样的。而出图性能和游戏性能表现并不是完全挂钩的,就像3060虽然它的张量核心比2060super先进一代,但数量实在太少,所以在这里并不占优。虽然英伟达给的这套测试标准比较简单粗暴,但是还是能比较直接的反映出图性能表现的,毕竟现在很多国内大神融的底模通过提示词直接抽卡也能获得比较不错的图片了。

第二个测试:画AI小姐姐
很多小伙伴更热衷于画AI小姐姐,所以第二个测试我们就来画AI小姐姐试试吧。这个测试我们将大模型换成了国内大佬炼的真人模型,同时给小姐姐使用了JK制服Lora、人物脸部Lora、黑丝Lora以及胶片风格Lora。为了得到更高清的AI小姐姐,不是,为了给显卡更大的压力,这次还加入了高分辨率修复Hires.Fix,将图片分辨率从初始的512768放大2倍到10241536。这一次的计算压力明显变大,即使强如4090,每分钟也只能画出3.75张图,也就是16秒才能画出一张图了。比较有意思的是在这样稍高一点的负载下,3060终于是跑赢了2060Super,4060也跑赢了2070Super。或许是高负载下大显存的优势会更明显,又或许是新版本的CUDA深度神经网络库(CUDNN)的优化更好。不知道屏幕前的小伙伴有没有更好的解释,来说说看吧。

第三个测试:Tile模型
抛开这些略有变化的排名,其他显卡的性能依旧和前一个测试是一致的。除了直接生图以外,ControlNet可以说是Stable Diffusion中必不可少的插件,强大之处无需多言。其中Tile模型也是广受大家喜爱,我们就来测一下它吧。Tile模型的作用之一就是高清修复模糊图片。我们这里用之前生成的一张512512的图片,放入Tile模型修复,并将分辨率提升至12801280。可以看到修复后的细节确实好了不少。4090每分钟出图5.45张,也就是每11秒就可以出一张图。依旧是压倒性的优势。不过其他显卡又有了一些细微的变化,大致来看的话,RTX 40系列的表现比前一个测试要好一些,4060Ti跑赢了3070Ti,4070 Ti也略微超过了3090 Ti。这或许真的是新版CUDA深度神经网络库(CUDNN)的优化更好。另外,这个分辨率的测试,根据SD的反馈,显存占用大概是9.1GB左右,也就是说超出了8GB显卡的显存容量,所以有着更大容量显存的卡表现会更好一些。比如说3060 12GB已经快赶上2070 SPUER了。而从4070开始,性能有明显的大幅提升。

总结
总体来看,测试中最低端的RTX 2060 SUPER的出图效率差不多刚好是最高端的4090的五分之一左右。大家一直说,生产力就上4090确实是没毛病啊。我们这块4090也是老熟人了,作为生产力工具来说效率确实高。因为这次测试也是尽量控制了不超过或者不过多的超出8GB显存这个范围,所以在这种使用条件下,GPU本身的性能是要比显存容量更为重要的。但是如果我们将出图数量除以价格,得到的每块钱出图效率的话,可以看到其实低端的2060Spuer和3060是有着很高的性价比的,而在RTX40系列中,4060Ti和4070有着较高的性价比。当然,这是在完全不考虑效率的情况下,如果你是作为生产力工具来使用的话,确实还是建议购买更高端的产品。比如如果算成24小时连续不断出图数量的话,4090要比2060SUPER多出4000张左右了,绝对数量的差距还是有些恐怖了。如果你有着直出高分辨率大图、炼丹等需求的话,大显存的高性能的卡才是更好的选择。因为在显存耗尽后,即使通过设置或插件达到不爆显存的操作,也是要调用内存处理,从而大幅增加出图时间的。在这种情况下,出图效率的差距就不是这么线性了。
2080Ti 22G和3070 16G
说到这里就顺便说说前面说到的魔改2080Ti 22G和3070 16G。如果说SD出图性能的话,这两块卡是差不多的。如果看前面测试3070的排名,大概就是处于那个位置。他们目前在二手市场的价格又只比新的4060高一点点,看起来好像还有点性价比。但是如果你只是玩一玩,大概率不是随时都能用得到这么大的显存的。目前很多模型其实都没有高分辨率优化,所以直出高分辨率图片大概率都是多头多脚,并不一定让你满意。而且20系和30系的矿卡那是满天飞,那魔改卡的来源呢,懂的都懂。所以买的话呢,恐怕你得做好足够的心理准备,因为它随时有坏掉的风险,你也可能随时联系不上店家失去保修,甚至装驱动都是一个问题。相信看到这里的各位小伙伴对Stable Diffusion中这些主流显卡的表现有一个大概的认知了吧,希望能对你的选购提供一点点帮助。不管你是支持还是反对,以Stable Diffusion为代表的AI终将会对我们未来的工作生活带来一些影响。