ユーザ用ツール

サイト用ツール


generative_ai:img:env

1_生成環境の選定

先に結論

ここでは、ローカルPCComfyUI を使ってみる
(お手軽にオンラインサービスで試してみたい場合は、こちらの記事を参照 > now printing)

環境を構成する主な要素

分類 結論 その他の候補
ソフトComfyUIA1111, Forge 等
(ミドル)python、他Rust, C++ 等
(OS)WindowsLinux 等
ベースローカルPCオンラインサービス 等

ベース(動作基盤)に何を使うか

こんな感じで選んでみた

候補モデルの自由度プロンプトの自由度生成時間生成回数備考
ローカルPC○ 差替え可○ 短い○ 無制限○ 無制限スペックを満たすPCと電気代が必要
有料レンタルサーバ○ 差替え可○ 無制限○ 短い△ 金次第無料で物足りなくてアップグレードするには十分
無料レンタルサーバ○ 差替え可○ 無制限△ 長い△ 上限有ちょい試しするなら必要十分
オンラインサービス△ 固定/差替× 制限有△ それなり△ 上限有ちょい試しするなら必要十分

※既存PC環境と懐具合で評価が変わる場合があります

ソフト(実行アプリ)に何を使うか

こんな感じで選んでみた

候補インストールの手間何か生成したい入力微変更した生成ガチャ備考
ComfyUI△ 慣れれば簡単○ 簡単○ フローを描く.
AUTOMATIC1111△ 慣れれば簡単○ 簡単× 入力し直し要求VRAM大
Forge△ 慣れれば簡単○ 簡単× 入力し直し要求VRAM中
reForge△ 慣れれば簡単○ 簡単× 入力し直し要求VRAM中
gradio× 使えるまで手間△ コードを書く△ コードを書く.

※やりたいことによって評価する項目が変わる場合があります

選定候補のソフト(順不同)

Stable Diffusion WebUI - AUTOMATIC1111版

https://github.com/AUTOMATIC1111/stable-diffusion-webui
・pythonのGradioライブラリを使用して実装された Stable Diffusion のWebインターフェイス
・入力パラメータを調整するだけで画像を出力できる
・大型モデルではVRAMを16GBとか24GBとか必要になるが、省RAMモデルも登場しているので試してみよう

Stable Diffusion WebUI - Forge版

https://github.com/lllyasviel/stable-diffusion-webui-forge
・pythonのGradioライブラリを使用して実装された Stable Diffusion のWebインターフェイス
・A!!!!から枝分かれした実験版
・リソース管理を最適化し推論をスピードアップを追求している
(A1111と同様の操作で少ないメモリでも動くとして利用者が増えていた)
・Gradio4をベースにした開発に移行(2024.6

Stable Diffusion WebUI - reForge版

https://github.com/Panchovix/stable-diffusion-webui-reForge
・pythonのGradioライブラリを使用して実装された Stable Diffusion のWebインターフェイス
・gradio3.41.2環境でのForge開発プロジェクトの後継として、Forgeのバージョン0.0.17から引き継がれ0.0.20が発表された (2024.07
・gradio4対応が落ち着くまでは、ノウハウが多く存在するSD1.5+gradio3の環境が主流として続くと思われる

ComfyUI

https://github.com/comfyanonymous/ComfyUI
・自由に部品(モデル,LoRA,加工,入出力,etc.)を線で繋げて出力を加工/調整できる
・フローを描くことで入出力を自由に作れる

gradio


https://www.gradio.app/
・アプリやWebページに埋め込むのにはイイ感じ
・コードを書かないといけないので今回は見送り

Diffusers

generative_ai/img/env.txt · 最終更新: 11/17 by chokai