目次
1_生成環境の選定
先に結論
ここでは、ローカルPCで ComfyUI を使ってみる
(お手軽にオンラインサービスで試してみたい場合は、こちらの記事を参照 > now printing)
環境を構成する主な要素
分類 | 結論 | その他の候補 |
---|---|---|
ソフト | ComfyUI | A1111, Forge 等 |
(ミドル) | python、他 | Rust, C++ 等 |
(OS) | Windows | Linux 等 |
ベース | ローカルPC | オンラインサービス 等 |
ベース(動作基盤)に何を使うか
こんな感じで選んでみた
候補 | モデルの自由度 | プロンプトの自由度 | 生成時間 | 生成回数 | 備考 |
---|---|---|---|---|---|
ローカルPC | ○ 差替え可 | ○ 短い | ○ 無制限 | ○ 無制限 | スペックを満たすPCと電気代が必要 |
有料レンタルサーバ | ○ 差替え可 | ○ 無制限 | ○ 短い | △ 金次第 | 無料で物足りなくてアップグレードするには十分 |
無料レンタルサーバ | ○ 差替え可 | ○ 無制限 | △ 長い | △ 上限有 | ちょい試しするなら必要十分 |
オンラインサービス | △ 固定/差替 | × 制限有 | △ それなり | △ 上限有 | ちょい試しするなら必要十分 |
※既存PC環境と懐具合で評価が変わる場合があります
ソフト(実行アプリ)に何を使うか
こんな感じで選んでみた
候補 | インストールの手間 | 何か生成したい | 入力微変更した生成ガチャ | 備考 |
---|---|---|---|---|
ComfyUI | △ 慣れれば簡単 | ○ 簡単 | ○ フローを描く | . |
AUTOMATIC1111 | △ 慣れれば簡単 | ○ 簡単 | × 入力し直し | 要求VRAM大 |
Forge | △ 慣れれば簡単 | ○ 簡単 | × 入力し直し | 要求VRAM中 |
reForge | △ 慣れれば簡単 | ○ 簡単 | × 入力し直し | 要求VRAM中 |
gradio | × 使えるまで手間 | △ コードを書く | △ コードを書く | . |
※やりたいことによって評価する項目が変わる場合があります
選定候補のソフト(順不同)
Stable Diffusion WebUI - AUTOMATIC1111版
https://github.com/AUTOMATIC1111/stable-diffusion-webui
・pythonのGradioライブラリを使用して実装された Stable Diffusion のWebインターフェイス
・入力パラメータを調整するだけで画像を出力できる
・大型モデルではVRAMを16GBとか24GBとか必要になるが、省RAMモデルも登場しているので試してみよう
Stable Diffusion WebUI - Forge版
https://github.com/lllyasviel/stable-diffusion-webui-forge
・pythonのGradioライブラリを使用して実装された Stable Diffusion のWebインターフェイス
・A!!!!から枝分かれした実験版
・リソース管理を最適化し推論をスピードアップを追求している
(A1111と同様の操作で少ないメモリでも動くとして利用者が増えていた)
・Gradio4をベースにした開発に移行(2024.6
Stable Diffusion WebUI - reForge版
https://github.com/Panchovix/stable-diffusion-webui-reForge
・pythonのGradioライブラリを使用して実装された Stable Diffusion のWebインターフェイス
・gradio3.41.2環境でのForge開発プロジェクトの後継として、Forgeのバージョン0.0.17から引き継がれ0.0.20が発表された (2024.07
・gradio4対応が落ち着くまでは、ノウハウが多く存在するSD1.5+gradio3の環境が主流として続くと思われる
ComfyUI
https://github.com/comfyanonymous/ComfyUI
・自由に部品(モデル,LoRA,加工,入出力,etc.)を線で繋げて出力を加工/調整できる
・フローを描くことで入出力を自由に作れる
gradio
https://www.gradio.app/
・アプリやWebページに埋め込むのにはイイ感じ
・コードを書かないといけないので今回は見送り