画像生成AI「Stable Diffusion Web UI」のインストール方法と基本的な使い方

画像生成AI「Stable Diffusion Web UI」のインストール方法と基本的な使い方

Stable Diffusion Web UI(AUTOMATIC1111)とは何か?

Stable Diffusion Web UI(AUTOMATIC1111)は、無料で使える画像生成AI「Stable Diffusion」を簡単に利用するためのWebアプリケーションです。

AUTOMATIC1111の主な利用方法は、ローカル環境にインストールする方法とGoogle Colabにインストール方法の2つの通りです

今回はより高い自由度で使えるローカル環境へのインストールを行い、実際に使ってみたいと思います。

※PCのスペックがあまり高くない場合は、「Stable Diffusion WebUI Forge」のインストールを試した方がいいかもしれません。

Stable Diffusion Web UIのインストール方法

Macでターミナルを使ってStable Diffusion Web UIをインストールし、起動する方法は下記の手順です。

1.Homebrew がインストールされているか確認します。

brew --version

HomebrewがPCに存在しない場合はインストールしてください。インストールして、Homebrewを PATH に追加します。

2.ターミナルで次のコマンドを実行し、必要なライブラリをインストールします。

brew install cmake protobuf rust python@3.10 git wget

3.Stable Diffusion web UIのリポジトリをローカルPCにcloneします。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

4.ターミナルで次のコマンドを実行し、Stable diffusion Web UIを起動します。

cd stable-diffusion-webui

./webui.sh

参考までにローカルに構築するまでの作業動画を作成しました。

Stable Diffusion Web UIを使って画像生成する基本的なプロンプト要素

まず、プロンプトに必要な基本的な情報は4つになります。

1.テイスト(表現手段)

例えば、鉛筆画や写真、コミック、チョーク画、彫刻、油絵など

2.被写体

例えば、猫や犬、靴、車、女性など

3.詳細

Sony fx3(撮影機材)、よりリアル、生活感のある、ハイクオリティなど

4.解像度

4K,Ultra HDなど

以上が基本的なプロンプトに必要な要素になります。

5.アーティスト名??

Stable Diffusion XL artists listはStable Diffusionでサポートされているアーティストのリストですが、著作権者の許可も得ていないことが問題視されています。特定のアーティストのスタイルを模倣した画像を生成することは、著作権侵害や盗作とみなされる可能性があります。また、Stable Diffusion XL Artists Listは、欧米のアーティストを中心としたデータセットで構成されています。そのため、他の地域や文化のアーティストのスタイルが反映されていない可能性があります。

高度なプロンプト要素

よりイメージをプロンプトに入力するためには下記の6つの情報が必要になります。

  • アングル / Wide shoto、Potoraitなど

  • 被写体の説明 / 長い髪、走っている、洋服の色など

  • 被写体のレンダリング /Blender3など

  • 背景 /サイバーパンクシティ、田園など

  • 背景の詳細

  • 明るさ、光 /シネマティックな光、ブルーのネオン、太陽光など

実際に画像生成にチャレンジ

デフォルトで選択されているStable Diffusionモデル「v1-5-pruned」を使用します。軽量なモデルで、アイデア出しやラフスケッチ、サムネイル画像作成におすすめのModelです。

それでは下記のプロンプトで作成してみましょう。

Prompt:

1980s, Tokyo at night, car chase, warm atmosphere, cartoony style, extremely detailed painting

Negative prompt:

lowres, error, cropped, worst quality, low quality, jpeg artifacts, out of frame, watermark, signature, deformed, ugly, mutilated, disfigured, text, extra limbs, face cut, head cut, extra fingers, extra arms, poorly drawn face, mutation, bad proportions, cropped head, malformed limbs, mutated hands, fused fingers, long neck, nsfw(Not safe for work)

prompt

出来上がりました。

xyz grid-0001-2038277871

高品質な画像生成 を求める場合のSampler(サンプル方法)は、DPM++ 2M、DPM adaptive、DPM++ SDE Karras がおすすめです。

高速な画像生成 を求める場合は、Euler a、UniPC がおすすめです。

アニメ風の画像生成 を求める場合は、UniPC がおすすめです。

ModelとSamplerの違い

ModelとSamplerは違います。

Modelは画像生成に使用するデータセットと学習済みパラメータの組み合わせです。Samplerはノイズから画像を生成する際の、画像の形状や質感を決定するアルゴリズムです。

Modelは絵筆、Samplerは絵具と考えると分かりやすいかもしれません。絵筆の種類によって、描ける絵のスタイルが変わります。絵具の種類によって、絵の色や質感が変わります。

ご相談やお仕事の依頼など
お気軽にお問い合わせください。

CONTACT