神器出炉！AI Toolkit by Ostris：小白必看，教科书般的模型训练秘诀

AI Toolkit by Ostris 解释

AI Toolkit 是一个由 Ostris 开发的、用于训练扩散模型的一体化训练套件。它旨在支持最新的图像和视频模型，并且可以在消费级硬件上运行。该工具包提供了命令行界面（CLI）和图形用户界面（GUI）两种运行方式，设计上既易于使用，又具备所有你可能需要的功能。

主要功能和特点

一体化训练套件：AI Toolkit 包含了训练扩散模型所需的所有工具，是一个完整的解决方案。
支持最新的模型：它持续更新以支持最新的图像和视频模型，例如 FLUX.1、OmniGen2、Wan I2V 等。
消费级硬件兼容：该工具包针对消费级硬件进行了优化，特别是配备足够 VRAM 的 NVIDIA GPU，让更多人可以在自己的设备上进行模型训练。
多界面支持：用户可以选择使用命令行界面进行配置和运行，也可以通过一个功能强大的网页界面（UI）进行操作。
易于使用：虽然功能丰富，但设计上追求简单易用，即使是新手也能通过直观的 UI 或配置示例快速上手。
高度可定制：用户可以通过配置文件（YAML）来精确控制训练的各种参数，包括网络类型（如 LoRA、LoKr）、训练层、学习率、数据集路径等。

用户界面（AI Toolkit UI）

AI Toolkit UI 是一个基于网页的界面，让用户可以更轻松地管理训练任务：
* 任务管理：可以方便地启动、停止和监控训练任务。
* 模型训练：只需几次点击就能轻松训练模型。
* 安全性：支持设置身份验证令牌（auth token），以防止未授权访问，使其可以在暴露的服务器上安全运行。

模型训练流程

使用 AI Toolkit 训练模型通常遵循以下几个步骤：
1. 环境准备：需要安装 Python 3.10+、Nvidia GPU、git 和 venv。
2. 安装：通过 git clone 克隆项目仓库，然后创建并激活 Python 虚拟环境，并安装所需的依赖，包括 PyTorch。
3. 数据集准备：
* 数据集应包含图像文件（JPG、JPEG、PNG）和对应的文本文件（TXT）。
* 图像和文本文件名必须一致（例如 image2.jpg 和 image2.txt）。
* 文本文件内包含图像的描述或标题。
* AI Toolkit 能够自动处理不同长宽比的图像，无需手动裁剪或调整大小。
4. 配置训练：
* 从 config/examples 文件夹中复制一个示例配置文件（如 train_lora_flux_24gb.yaml），并进行修改。
* 在配置文件中，你可以指定数据集路径、模型路径、训练参数、网络类型（如 LoRA）等。
5. 运行训练：
* 在命令行中运行 python run.py config/你的配置文件名.yml 来启动训练。
* 训练过程会生成一个带有检查点和样本图像的输出文件夹。
* 你可以随时使用 ctrl+c 停止训练，并在之后从最近的检查点继续。

支持的训练技术

AI Toolkit 支持多种训练技术，为用户提供了极大的灵活性：
* LoRA (Low-Rank Adaptation)：通过调整配置文件中的 network 参数，可以训练 LoRA 模型。用户还可以通过 only_if_contains 或 ignore_if_contains 参数精确地选择要训练或排除的特定层。
* LoKr (Low-rank K-adapter)：同样，只需在配置文件中将网络类型设置为 "lokr"，即可使用 LoKr 进行训练。

特殊模型支持

该工具包特别强调了对 FLUX.1 模型的训练支持：
* FLUX.1-dev：该模型有非商业许可证，因此使用它训练的模型也受此许可证约束。用户需要先在 Hugging Face (HF) 上接受许可证并获取一个只读访问令牌，并将其配置在项目的 .env 文件中。
* FLUX.1-schnell：该模型采用 Apache 2.0 许可证，可用于商业用途。训练时需要使用一个特定的 adapter (ostris/FLUX.1-schnell-training-adapter)，并且推荐调整采样步数。