AI作画离线版V7.0 使用教程

AI前沿3年前发布 wanglu852

117,117 0 0

AI作画离线版V7.0 使用教程

01 软件概览

软件名字：AI作画离线版V7.0，基于GitHub上的开源项目Disco Diffusion与Stable Diffusion以及众多开源项目。操作简单为主。

02 软件安装

软件庞大，包含多个离线模型，根据需求下载完成后，按照网盘内的PDF教程进行体验。软件界面如下：

03 软件功能介绍

3.1 SD(Stable Diffusion)作画

SD作画是目前最流行的开源作画框架，支持文生图、图生图、文字生成视频animatediff、SD动画deforum等功能。

描述词设定：正负描述，描述词包括正描述和负描述，负描述默认可以不写，负描述如果写，就代表不想让绘画结果出现的元素。队列模式下可生成大量配置文件。

比如我的文字描述这样描述：a beautiful girl by {400|1|艺术家}，当点击保存设置后就会生成400个艺术家的不同配置文件。

注意这个格式{400|1|艺术家}中的{}、|这些不能缺少，完全按照固定格式来，400代表生成400个配置文件，1代表by一个艺术家名字（如果设置成2就代表by两个艺术家名字混搭），艺术家代表的是软件目录下【描述风格库】文件夹下的艺术家.csv文件，而艺术家.csv文件如下所示，两列数据：

软件支持各位自建这种语料库，大家可以复制csv建立副本，然后在副本里修改，注意也是按照两列格式来，第一列是描述，第二列是解释。比如下面我建的颜色.csv文件，简单写了一下，也是一定严格两列来哈，且都放在软件目录下的【描述风格库】文件夹。

‍
AI生成描述：支持开头，点击AI生成描述进行续写，有两种自动写描述引擎。
绘图参数：设置绘制图片轮数、描述相关度、随机种子等参数。

当采样器选择LCM时，如下步数可以设置5，描述相关度推荐0，即可实现加速出图，如下：
SVD视频创作：支持SVD动画，可选择参考图、设置多个参数。

‍
LCM采样器：新增LCM采样器，5步出图，可配合特定模型。

‍
Diffusers模式：支持显存占用模式选择diffusers模式，可加载多个lora混合加载。

‍

AI作画离线版V7.0，SVD图片生成视频、LCM秒速出图、极速视频无抖动重绘来啦！ – 哔哩哔哩 (bilibili.com)

‍

3.2 CN作画

CN是 ControlNet，支持不同模型用于针对不同参考图进行创作。包括Lineart、SEG、MLSD、超分辨率Tile、二维码等。

CN模型演示

3.3 DD(Disco Diffusion)作画

描述词设定：默认描述，每段为同一描述的不同权重关键词。
图生图：点击按钮选择图片，设置参数，skip_steps参数加入参考图时需要设置大一些。
AI作画模型选择：提供两种绘图Diffusion模型引擎选择，原版DD、像素版DD以及其他自定义的PT格式模型。

演示国画模型：

3.4 图片/视频AI高清放大

设置不同放大模型和图片放大倍数，高清放大图片输出目录为软件目录\images_out\AI_ultra_HD。支持2-10倍放大。

高清放大效果

3.5 老照片修复

选择老照片修复选项，高清修复人像，仅对人像进行修复。

老照片修复效果

3.6 图片/视频上色

选择图片/视频上色，支持不同上色模型，二次元模型专注二次元线稿上色。

上色效果

3.7 图片说话

图片说话功能，将导入的图转换成说话人视频的形式，支持音频和视频驱动，默认音频驱动说话。

图片说话效果

3.8 AI图片转3D

输出视频目录为软件目录\video，支持原图尺寸大小的视频。

AI图片转3D效果

3.9 抠图

选择抠图，进行背景和人物分割。

抠图效果

3.10 二次元生成

选择二次元生成，可绘制上百张二次元图片。

二次元生成效果

3.11 三次元生成

选择三次元生成，可绘制上百张三次元图片。

三次元生成效果

3.12 AI写小说

选择AI写小说|聊天界面，设置开头，可续写不同轮数的文字。支持训练自己的模型。

AI写小说效果

3.13 伴奏人声分离

选择伴奏人声分离，自动分离人声、伴奏、鼓点和低音。

3.14 音视频转文字

选择音视频转文字，进行语音识别，输出字幕和文字版txt文件。

音视频转文字效果

3.15 视频补帧

支持视频2-16倍补帧，原理是通过计算相邻两帧脑补出中间大量帧。

视频补帧效果

3.16 文字生成音乐

支持文字生成音频设置，支持批量输入，支持参考音频，生成音乐。

04 显卡要求

需要至少2GB显存，必须是英伟达显卡，不支持AMD、intel等其他显卡。

05 小结

这个项目很有趣，显卡要求高，至少需要英伟达2G及以上显存。详细的作图参数、教程可参考B站相关视频。

06 本期内容获取

百度网盘：链接提取码：95

AI前沿

文章版权归作者所有，未经允许请勿转载。

CogVideoX：开源视频生成技术的未来探索与创新

AI前沿

2年前

23,8640

揭秘 MuleRun：首个AI Agent市场，如何让创作者轻松赚钱？

AI前沿 # Agent # AI # MuleRun

10个月前

61,3410

全面掌握Skills：低代码智能Agent开发与应用指南！

AI前沿 # Agent # AI # Skills

6个月前

13,2320

Qwen3 Coder：最强开源代码模型，四种方案详解，应用案例展示

AI前沿 # Coder # Qwen3 # Qwen3Coder

12个月前

40,5760

AI作画离线版V7.0 使用教程

AI作画离线版V7.0 使用教程

01 软件概览

02 软件安装

03 软件功能介绍

3.1 SD(Stable Diffusion)作画

3.2 CN作画

3.3 DD(Disco Diffusion)作画

3.4 图片/视频AI高清放大

3.5 老照片修复

3.6 图片/视频上色

3.7 图片说话

3.8 AI图片转3D

3.9 抠图

3.10 二次元生成

3.11 三次元生成

3.12 AI写小说

3.13 伴奏人声分离

3.14 音视频转文字

3.15 视频补帧

3.16 文字生成音乐

04 显卡要求

05 小结

06 本期内容获取

Start AI,无需显卡及特殊网络可轻松在PhotoShop内实现文生图、扩图！

Roop、Rope和FaceFusion三大主流换脸软件比较

相关文章

CogVideoX：开源视频生成技术的未来探索与创新

揭秘 MuleRun：首个AI Agent市场，如何让创作者轻松赚钱？

全面掌握Skills：低代码智能Agent开发与应用指南！

Qwen3 Coder：最强开源代码模型，四种方案详解，应用案例展示

热门文章

智能体

AI作画离线版V7.0 使用教程

AI作画离线版V7.0 使用教程

01 软件概览

02 软件安装

03 软件功能介绍

3.1 SD(Stable Diffusion)作画

3.2 CN作画

3.3 DD(Disco Diffusion)作画

3.4 图片/视频AI高清放大

3.5 老照片修复

3.6 图片/视频上色

3.7 图片说话

3.8 AI图片转3D

3.9 抠图

3.10 二次元生成

3.11 三次元生成

3.12 AI写小说

3.13 伴奏人声分离

3.14 音视频转文字

3.15 视频补帧

3.16 文字生成音乐

04 显卡要求

05 小结

06 本期内容获取

Start AI,无需显卡及特殊网络可轻松在PhotoShop内实现文生图、扩图！

Roop、Rope和FaceFusion三大主流换脸软件比较

相关文章

CogVideoX：开源视频生成技术的未来探索与创新

揭秘 MuleRun：首个AI Agent市场，如何让创作者轻松赚钱？

全面掌握Skills：低代码智能Agent开发与应用指南！

Qwen3 Coder：最强开源代码模型，四种方案详解，应用案例展示

标签云

热门文章

智能体