AI作画离线版V7.0 使用教程
01 软件概览
软件名字:AI作画离线版V7.0,基于GitHub上的开源项目Disco Diffusion与Stable Diffusion以及众多开源项目。操作简单为主。
02 软件安装
软件庞大,包含多个离线模型,根据需求下载完成后,按照网盘内的PDF教程进行体验。软件界面如下:
03 软件功能介绍
3.1 SD(Stable Diffusion)作画
SD作画是目前最流行的开源作画框架,支持文生图、图生图、文字生成视频animatediff、SD动画deforum等功能。
-
描述词设定: 正负描述,描述词包括正描述和负描述,负描述默认可以不写,负描述如果写,就代表不想让绘画结果出现的元素。 队列模式下可生成大量配置文件。
比如我的文字描述这样描述:a beautiful girl by {400|1|艺术家},当点击保存设置后就会生成400个艺术家的不同配置文件。
注意这个格式{400|1|艺术家}中的{}、|这些不能缺少,完全按照固定格式来,400代表生成400个配置文件,1代表by一个艺术家名字(如果设置成2就代表by两个艺术家名字混搭),艺术家代表的是软件目录下【描述风格库】文件夹下的艺术家.csv文件,而艺术家.csv文件如下所示,两列数据:
软件支持各位自建这种语料库,大家可以复制csv建立副本,然后在副本里修改,注意也是按照两列格式来,第一列是描述,第二列是解释。比如下面我建的颜色.csv文件,简单写了一下,也是一定严格两列来哈,且都放在软件目录下的【描述风格库】文件夹。
-
AI生成描述: 支持开头,点击AI生成描述进行续写,有两种自动写描述引擎。
-
绘图参数: 设置绘制图片轮数、描述相关度、随机种子等参数。
当采样器选择LCM时,如下步数可以设置5,描述相关度推荐0,即可实现加速出图,如下:
-
SVD视频创作: 支持SVD动画,可选择参考图、设置多个参数。
-
LCM采样器: 新增LCM采样器,5步出图,可配合特定模型。
-
Diffusers模式: 支持显存占用模式选择diffusers模式,可加载多个lora混合加载。
AI作画离线版V7.0,SVD图片生成视频、LCM秒速出图、极速视频无抖动重绘来啦! – 哔哩哔哩 (bilibili.com)
3.2 CN作画
CN是ControlNet,支持不同模型用于针对不同参考图进行创作。包括Lineart、SEG、MLSD、超分辨率Tile、二维码等。
3.3 DD(Disco Diffusion)作画
-
描述词设定: 默认描述,每段为同一描述的不同权重关键词。
-
图生图: 点击按钮选择图片,设置参数,skip_steps参数加入参考图时需要设置大一些。
-
AI作画模型选择: 提供两种绘图Diffusion模型引擎选择,原版DD、像素版DD以及其他自定义的PT格式模型。
演示国画模型:
3.4 图片/视频AI高清放大
设置不同放大模型和图片放大倍数,高清放大图片输出目录为软件目录\images_out\AI_ultra_HD。支持2-10倍放大。
3.5 老照片修复
选择老照片修复选项,高清修复人像,仅对人像进行修复。
3.6 图片/视频上色
选择图片/视频上色,支持不同上色模型,二次元模型专注二次元线稿上色。
3.7 图片说话
图片说话功能,将导入的图转换成说话人视频的形式,支持音频和视频驱动,默认音频驱动说话。
3.8 AI图片转3D
输出视频目录为软件目录\video,支持原图尺寸大小的视频。
3.9 抠图
选择抠图,进行背景和人物分割。
3.10 二次元生成
选择二次元生成,可绘制上百张二次元图片。
3.11 三次元生成
选择三次元生成,可绘制上百张三次元图片。
3.12 AI写小说
选择AI写小说|聊天界面,设置开头,可续写不同轮数的文字。支持训练自己的模型。
3.13 伴奏人声分离
选择伴奏人声分离,自动分离人声、伴奏、鼓点和低音。
3.14 音视频转文字
选择音视频转文字,进行语音识别,输出字幕和文字版txt文件。
3.15 视频补帧
支持视频2-16倍补帧,原理是通过计算相邻两帧脑补出中间大量帧。
3.16 文字生成音乐
支持文字生成音频设置,支持批量输入,支持参考音频,生成音乐。
04 显卡要求
需要至少2GB显存,必须是英伟达显卡,不支持AMD、intel等其他显卡。
05 小结
这个项目很有趣,显卡要求高,至少需要英伟达2G及以上显存。详细的作图参数、教程可参考B站相关视频。
06 本期内容获取
- 百度网盘:链接 提取码:95