Stable Diffusionを試す

 


 前回、家にある余ったパーツで3rdPCを組みUbuntuのインストールを行いましたが、今回はそのパソコンに「Stable Diffusion WebUI」をインストールして動かそうと思います。

 ただAI画像生成というとGPUメモリを多く必要とするため、GPUメモリが6GBしかないGTX1060ではかなり厳しく、実際インストールと画像生成は出来たのですが、容量の大きなモデルを動作させること自体が困難で、低解像度でしか画像を生成できず、標準で搭載されている「Hires.fix」でのアップスケーリングもGPUのメモリ不足ですぐエラーになりました。

 厳しいだろうということは予想していたので「Stable Diffusion WebUI Forge」という低VRAM環境に最適化されたバージョンを新たにインストールしました。こちらだと容量の大きなモデルも動かすことが出来ました。アップスケーリングも時間はかかりますが1600×1600まで解像度を上げることが出来ました。


 「Stable Diffusion WebUI Forge」での画像生成時間を計測してみましょう。

 条件を揃えるためプロンプトと生成方法は以下のようにしてシード値を固定し9枚の画像を連続で生成して計測します。

プロンプト
masterpiece, anime coloring, anime screenshot, 1girl, solo, solo focus, indoors, cowboy shot, dynamic angle, looking at viewer, smaller female, short hair, hair between eyes, blue hair, yellow eyes,

SD1.5系での出力結果

512×512 画像9枚生成 約2分10秒 (1枚あたり約14秒)

 SD1.5系は動作が軽い印象なので早く感じます。


 次は設定をそのままに「Hires.fix(高解像度補助)」のアップスケーラー設定を追加し、解像度を二倍にして出力します。

SD1.5系モデル+Hires.fixでの出力結果

512×512 → 1024×1024 画像9枚生成 9分50秒 (1枚あたり約1分5秒)

 Hires.fixでの高解像度化は便利で綺麗なんですが処理が重く時間も結構増えますね。それでもこのスペックで結構頑張ってますね。


PONY系での出力結果

512×512 画像9枚生成 5分23秒 (1枚あたり約35秒)

 SD1.5系と比べて約二倍の時間がかかってます。


PONY系+Hires.fixでの出力結果

512×512 → 1024×1024 画像9枚生成 16分21秒 (1枚あたり約1分49秒)

 PONY系モデルは容量が大きいので「Stable Diffusion WebUI」では動作困難でしたが、「Stable Diffusion WebUI Forge」であればGTX 1060 6GBでも時間はかかりますが動作してくれるようです。


 次は試しにPONY系モデルで800×800の画像をHires.fixで二倍の1600×1600にアップスケーリングして出力してみます。

800×800 → 1600×1600 画像1枚 5分22秒

 1枚の画像生成ですが解像度が大きくなると時間はかなり長くなります。9枚連続で生成すると50分近く時間がかかることになります。


まとめ

 Stable Diffusion WebUI Forge版でGTX1060 6GB版を使用しての画像生成速度

モデルHires.fix 高解像度補助生成時間
SD1.5系 512×512 9枚なし約2分10秒(1枚約14秒)
SD1.5系 512×512 9枚512×512 → 1024×1024約9分50秒 (1枚約1分5秒)
PONY系 512×512 9枚なし約5分23秒 (1枚約35秒)
PONY系 512×512 9枚512×512 → 1024×1024約16分21秒 (1枚約1分49秒)
PONY系 800×800 9枚800×800 → 1600×1600約48分18秒 (1枚約5分22秒)

 とりあえず画像生成は出来るといった感じで生成時間を気にしなければそれなりの解像度も出力することが出来ます。

 プロンプトの内容も短くLORA等の追加学習も入れていないので、それらを追加した場合はさらに生成時間が長くなります。

 他にも「GPUメモリの使用量が減る」「生成速度が速くなる」と言われている設定や、拡張機能のインストールなども色々試してみましたが、そのほとんどが効果無く逆に不具合に遭遇することが多く何度か再インストールして、結局そのままの状態で使った方が安定するという結論になりました。

 あとは単純にGTX1060の性能が不足している点です。これ以上を求めるならもう素直にグラフィックボードを購入したほうが良いと思います。

 手持ちのGTX1060がシングルファンなので、生成しているときはファンが常に100%の状態で、騒音も結構酷く、PCケース自体もほんのり温かくなっている状態でした。GPU温度も80℃を超えているのでこのままの使用はリスクが大きいです。

 常用するならケースファンの増設やケース内のエアフローを見直す必要があります。

 うーん、このまま使うことは無いかなぁ



投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です