Stable Diffusion 自作LORAが簡単、拡張機能『sd-webui-train-tools』の導入と使い方 【高速化xformers導入】

のぶっち先生
7 Jun 202308:22

TLDR本動画では、Stable Diffusionの拡張機能『sd-webui-train-tools』の導入と使い方について説明しています。まず、Xformersの高速化オプションを導入することが前提となり、最低でもRTX3000シリーズの8GBが必要です。次に、トレインツールズの導入手順や各項目の設定方法、プロジェクトの作成方法を紹介しています。また、教師データの取り扱いやモデル選択、学習速度の向上に関する設定も解説。実写系モデルとアニメモデルで生成した結果も共有し、改善点についても触れています。視聴者からのコメントも歓迎しています。

Takeaways

  • 🚀 SDWEBUIの拡張機能『TrainTOOLS』の導入について説明。
  • 💻 RTX3000番台の8GB以上のGPUが必要。
  • ⚡ Xフォーマーズ高速化オプションの導入方法が簡単。
  • 📂 プロジェクトを作成し、教師データとして画像とキャプションを使用。
  • 📝 教師データにはテキストファイルも含めることが可能。
  • 🔧 イメージサイズは512x512で設定可能。
  • ⏳ トレーニング回数やエポックスの設定により品質が変わるが、回数が多ければ良いとは限らない。
  • 🎨 ベースモデルはアニメや実写など、使用目的に応じて選択可能。
  • ⚙️ 学習速度向上のためにXフォーマーズを有効にする。
  • 📊 エポックス設定やバッチサイズはマシンスペックに合わせて調整可能。

Q & A

  • Train Toolsの導入に必要な前提条件は何ですか?

    -Xformersの高速化オプションを導入しておくことが前提条件で、さらに最低でもRTX3000番台の8GBのGPUが必要です。

  • Xformersのインストール手順は?

    -空のテキストファイルを作成し、そこに『set commandline=2xformers』と記載し、保存後にWeb UIを起動するとXformersがインストールされます。

  • Train Toolsのプロジェクト作成方法は?

    -右上の『Create Project』をクリックし、プロジェクト名を入力します。その後、『Create Version』をクリックして、バージョンを指定します。

  • 教師データの追加方法は?

    -画像とキャプションファイル(テキストデータ)を個別にアップロードします。フォルダごとではなく、個別のファイルを投げる必要があります。

  • トレーニングの繰り返し回数の設定はどのように行いますか?

    -繰り返し回数は、素材の枚数とエポック数の掛け算で決まります。回数を増やしても品質が向上するとは限りません。

  • ベースモデルの選び方について教えてください。

    -アニメモデルの場合はアニメモデル、実写モデルの場合は実写モデルを選ぶのが推奨されています。

  • Xformersを有効にする方法は?

    -Xformersをダウンロードした後、チェックボックスをオンにして学習速度を向上させることができます。

  • クリップスキップの設定はどうすればいいですか?

    -アニメモデルを使用する場合は、クリップスキップの値を2に設定します。

  • バッチサイズの設定方法は?

    -バッチサイズはPCのスペックによって学習速度に影響します。最初は1で試してみることを推奨します。

  • 学習結果の確認方法は?

    -アップデートが終了すると、左側の欄に学習素材が表示され、そこから学習を開始できます。生成されたファイルはStable Diffusionのautopt内のフォルダに保存されます。

Outlines

00:00

📈 Introduction to SDWEBUI and TrainTOOLS Setup

In this section, the speaker introduces the topic of installing and using SDWEBUI and TrainTOOLS. They emphasize the importance of having XFormers installed for faster performance and a minimum requirement of an RTX 3000 series GPU with at least 8GB of VRAM. They warn that some results may differ from expectations but encourage viewers to continue watching. The steps for installing XFormers are outlined: creating an empty text file and adding a command for installation. The speaker notes that any issues during installation will need to be addressed at the viewer's own risk. The installation of TrainTOOLS is then explained, starting with copying and pasting a link provided in the video description. After restarting the UI, a 'TrainTOOLS' option should appear.

05:01

🛠️ Using TrainTOOLS: Project Creation and Data Setup

The speaker explains how to create a new project in TrainTOOLS. After clicking 'Create Project,' users should input a trigger name (with an example using a humorous name) and leave the version number as 1, though users can change it if desired. They discuss the process of uploading training data, clarifying that images and captions should be uploaded directly rather than as folders. However, the speaker admits uncertainty regarding whether text files are required. They then cover image size settings, suggesting that 512x512 pixels is acceptable. A brief explanation is given for adding captions and updating the training folder, though the speaker admits to not fully understanding certain sections and recommends using auto settings.

Mindmap

Keywords

💡Xフォーマーズ

XフォーマーズはStable Diffusionのモデルを高速化するための技術で、今回の動画のメインとなる導入手順で重要な要素です。動画では、このオプションを設定することで、モデルのトレーニング速度を向上させることが強調されています。

💡RTX3000番台

RTX3000番台はNVIDIAのGPUシリーズで、この動画では、Stable Diffusionやトレーニングツールの効率的な使用に最低でも8GBのメモリを持つRTX3000番台のGPUが必要であると説明されています。

💡WEBUIユーザバット

WEBUIユーザバットは、Stable Diffusionの設定やXフォーマーズのインストールを行うためのファイルで、動画ではこのファイルを編集することで高速化オプションを有効化する手順が解説されています。

💡トレインツールズ

トレインツールズは、Stable DiffusionのLoRAモデルをトレーニングするための拡張機能です。動画では、このツールのインストール方法や設定方法が詳しく説明されており、LoRAモデルの作成に役立つ機能です。

💡クリエイトプロジェクト

トレインツールズ内の機能で、新しいプロジェクトを作成するために使います。動画では、トリガーとなる名前を入力し、プロジェクトを開始する方法が紹介されています。

💡教師データ

教師データは、モデルに学習させるための元データです。動画では、画像とテキストデータを使用してモデルを訓練する方法が説明されており、教師データを適切に準備することが重要であるとされています。

💡ベースモデル

ベースモデルは、トレーニングの元となる既存のモデルです。動画では、アニメモデルや実写モデルを選択する際の考慮点が説明されており、使用するモデルに応じて結果が異なることが強調されています。

💡クリップスキップ

クリップスキップは、アニメモデルのトレーニング時にスキップするレイヤーの設定です。動画では、アニメモデルの場合は2に設定することが推奨されており、これがトレーニングの品質に影響を与えるとされています。

💡バッチサイズ

バッチサイズは、トレーニング時に同時に処理されるデータの量を指します。動画では、パソコンのスペックによってバッチサイズを調整することで、学習速度を最適化できると説明されています。

💡エポックス

エポックスは、モデルのトレーニングでデータセットを何回繰り返して学習させるかを示す回数です。動画では、エポックスの設定により、学習品質が変わる可能性があると述べられており、20から40回の設定が推奨されています。

Highlights

SDWEBUIとTrainTOOLSの導入についての説明。

高速化オプション「Xフォーマーズ」の導入が必要。

RTX3000シリーズ以上の8GBのGPUが推奨されている。

Xフォーマーズのインストール手順は、空のテキストファイルに指定のコマンドを書いて保存する。

TrainTOOLSのインストールは簡単で、概要欄のリンクをコピーして貼り付ける。

「クリエイトプロジェクト」をクリックし、プロジェクト名を設定する。

教師データには画像ファイルとテキストデータを使用。

繰り返し回数の設定は、素材の枚数とエポック数によって決まる。

アニメモデルの場合、クリップスキップを「2」に設定するのが推奨。

ローラーファイルが多く生成されないよう、「セーブエブリィ」を「0」に設定。

バッチサイズの設定は、PCのスペックによって学習速度が変わる。

エポック数は20から40が推奨される。

設定完了後、「北京ドレン」をクリックして学習を開始する。

生成されたローラーファイルはStable Diffusionのautoptフォルダ内に保存される。

学習素材10枚を使って実写系モデルで生成を試みたが、期待した結果とは少し異なる。