『当サイトはプロモーションを含みます』

AIイラスト作成の実践的な覚え書き①「Stable DiffusionとFooocusを試してみた!お気に入りAIイラスト生成ツールの特徴と機能」

000 AIイラスト

AIイラスト作成ツールを実際に使ってみたときに、気になったことや忘れたくないことを、覚え書きふうに記してみました。

これからAIでイラストを作ってみたいと思っている方にとって、なんらかの助けになればとてもうれしいです♪

お気に入りのAIイラスト生成ツール

08

「NMKD Stable Diffusion GUI」x「Fooocus」による作成

個人的には、Stable Diffusion系のツールがお気に入りです。基本的に、ローカル環境にインストールして使います。

使いやすくてわかりやすいというのが、お気に入りの一番の理由でしょうか。無料で使えるのも大きいですね。

アップデートするたびに新機能が追加されていくのも、とても好感が持てます。

NMKD Stable Diffusion GUI

「NMKD Stable Diffusion GUI」は、ローカルへのインストールを前提にしたStable Diffusion系のAIイラスト作成ツールです。

公式サイト:NMKD Stable Diffusion GUI – AI Image Generator

メリット

  • 無料で使える
  • 外付けのデバイスへインストールしても使える(USBメモリやSDカードでも可)
  • インストールが簡単
  • 使えるモデルが豊富(商用利用の可能なモデルも多い)
  • AIが判断してくれる範囲・自由度が高い
  • アダルティなイラストが作り放題♡
■無料で使える

なんといっても、無料で使えるのは大きなメリットです。

ウェブ経由でAIイラストを作成できるサイトも数多くありますが、ほとんどがサブスクなど有料を前提にしています。それを考えると、無料で使えるのは、破格のサービスです。

正確にはカンパウェアらしいのですが、カンパをせずとも問題なくダウンロードできます

 公式サイトでツールをダウンロードしようとして「Download Now」をクリックすると、金額が表示されますが、あわてる必要はありません。金額の上の「No thanks, just take me to the downloads」をクリックすると、そのままダウンロード画面に移ります

■外付けのデバイスにインストールしても使える

「NMKD Stable Diffusion GUI」のインストールには、かなりの容量が必要です。そのうえ、モデルデータも大きいものが多いため、パソコン本体の容量が少ないと、あっという間に容量が足りなくなってしまいます。

でも、外付けのデバイスにインストールしても使えるので安心してください。実際に、私もUSBメモリにインストールして使用しています。

外付けで使えることが分からなかったときは、なかなか大変でした。気に入ったモデルがあっても、データが大きいと入れるのをためらったり、すでに入れていたモデルを削除してから入れたりしていたのです。

でも今は、パソコン本体の容量を気にすることなく、気に入ったモデルを好きなだけ入れて使っています♪

■インストールが簡単

インストールは、何も難しいことはありません。いったんインストールがスタートしたら、あとは最後まで勝手に進んでくれます

インストールに時間はかかりますが、ただ終わるのを待っているだけでいいので何もしなくて済みますよ。

ただし、推奨環境に満たないパソコンでは、インストールしても起動できないので、注意が必要です。

「NMKD Stable Diffusion GUI」の推奨環境

OS:Windows(64bit)
CPU:インテル系ならCore i5~Core i7、AMD系ならRyzen 5~7(新しいモデルほど安心です)
グラフィックボード:8GB以上のVRAM(ビデオメモリ)を積んだNVIDIA系モデル(RTX 30シリーズやRTX 40シリーズ)
※ VRAM6GBのRTX 20シリーズでも起動を確認しています
PC本体の物理メモリ:16GB以上

■使えるモデルが豊富

アニメ調やフォトリアル調など、使えるモデルの種類が豊富です。モデル専用のサイトを見ると、数え切れないほどのモデルがアップされおり、そのほとんどが自由に無料でダウンロードできます

おすすめのモデル取得サイト:CIVITAI Models

上記のサイトには、ベースとなるモデルデータからVAE、LoRAなど、ほぼなんでも揃っています。モデルによって微妙に表現が違うので、好みに合わせたモデルを探すのも楽しみです♪

ちなみに私は、お気に入りのメインモデルとしてアニメ調に特化した「AOM3B4_orangemixs」を使っています。何といっても、可愛らしい女の子を作成できるのが最高です。あと、VAEには「vae-ft-mse-840000-ema-pruned」を使い、LoRAは使用していません。

モデルデータ「AOM3B4_orangemixs」取得先:WarriorMama777/OrangeMixs 

■AIが判断してくれる範囲・自由度が高い

「NMKD Stable Diffusion GUI」は、簡単なプロンプトを指定しても、それをもとに、構図や表情、人数まで、さまざまな絵を作成してくれます。

もちろん、プロンプトに忠実な絵を作成するように設定することも可能です。でも、あまりにもプロンプトへの縛りが強いと、個人的には面白みが足らないように感じます。

やはり、イメージしていたものよりも一段上の意外性のあるイラストが作成されるのがとても楽しいです。「NMKD Stable Diffusion GUI」は、十分その思いに応えてくれるツールといえます。

たとえば、下のイラストは、単に「夏の海辺ではしゃいでいる超可愛い猫耳少女」的なプロンプトを入れたに過ぎません。まさか、空中に飛び跳ねている猫耳少女を作成してくれるとは思いもしませんでした

01

「NMKD Stable Diffusion GUI」による作成

※「AIでイラストを作ってみた!猫耳コレクション ⑤「海辺の猫耳少女たち・その1」」より

AIの自由度を調整する目安

プロンプトの内容を「NMKD Stable Diffusion GUI」に反映させるには、インターフェースの中ほどにある「Prompt Guidance (CFG Scale)」のスライダーを調整します。

以下は、あくまでも「NMKD Stable Diffusion GUI」を使ってみた個人としての感触です。

「7~10」の範囲だとかなりAIの自由度が高く、思ってもいない面白い構図を作ってくれるのでおすすめです。
「11~14」あたりだと、まだある程度は面白い構図ができますが、少しおとなし目になります。
「15~18」にすると、ほぼプロンプト通りの構図になり、変化はあまり期待できません。

ここで注意したいのは、数値を上げるほどイラストがモヤって色調もおかしくなってしまうことです。これは、解像度が低いほど発生しやすい傾向にあります。

たとえば、以下のイラストでもわかるように、スライダーの数値が15の場合、512 x 512だとすでにモヤって見づらくなっています。でも、1024 x 1024ではまだクリアで見やすいことがわかるでしょう。

▼512 x 512のイラスト(パジャマを着てベッドに座っている少女)

16

▼1024 x 1024のイラスト

17

■アダルティなイラストが作り放題

ちまたにあふれているWEBサイト経由でのAIイラスト作成ツールのほとんどは、アダルティなプロンプトに対して縛りがあります。

ポリシーの問題なのでしょうが、ちょっとエッチっぽい文言を加えただけで、はねられてしまうことが多いのです。下着姿でもNG扱いされることがあります。

たとえば、以下のように温泉に入って楽しんでいる猫耳少女のイラストさえ、はねられる可能性が高いです。

02

「NMKD Stable Diffusion GUI」による作成

※ 「AIでイラストを作ってみた!猫耳コレクション ⑦「猫耳少女陸戦隊 露天温泉がまん大会」」より

それに比べて、ローカルで動かす「NMKD Stable Diffusion GUI」には、まったく縛りがありません。どのようなエッチなプロンプトでも、思ったとおりに作成してくれます♡

女性の身体の危ない部分を指定したり、男女の危ない行為を指定したりしても、ちゃんと作成してくれるんです。

そのたぐいのイラストがほしい人にとっては、まさに神のごときツールといえるかもしれませんね。

ちなみに、以下のブログは「NMKD Stable Diffusion GUI」で作成したイラストを使って作っています。ほかにも、さまざまなテーマで作っていますので、ぜひ、楽しんでみてください。

デメリット

神ツールのような「NMKD Stable Diffusion GUI」にも、以下のようなデメリットがあります。

  • 性能の高いグラフィックボードが必要
  • モデルの種類が多すぎて選択に迷ってしまう
  • VAEやLoRAの種類が多すぎて組み合わせに迷ってしまう
■性能の高いグラフィックボードが必要

「NMKD Stable Diffusion GUI」の最大のデメリットは、動かすために8GB以上のメモリを積んだグラフィックボードが必要だということでしょう。

なお、公式での推奨はあくまでも8GB以上ですが、6GBのグラフィックボードでも使うことが可能です。ただし、画像を後付で学習させる機能は使えません。それ以外なら、十分普通に使えます。

実際に、私が使っているパソコンのグラフィックボードも6GBですが、「NMKD Stable Diffusion GUI」は普通に動いていますよ♪

■モデルやVAE、LoRAの種類が多い件

「NMKD Stable Diffusion GUI」には、使用できるメインのモデルデータや、その補助をするVAEやLoRAの種類が豊富にあります。

あり過ぎて、どれを使っていいのか迷ってしまうほどです。

そのため、お気に入りのモデルやVAE、LoRAなどを見つけるのに、必要以上に時間を使ってしまうことがあります。

でも、これは贅沢な悩みといえるかもしれませんね。

お気に入りのモデルやVAE、LoRAの組み合わせを見つけたときは、もう天にも昇る心地がします♪

Fooocus

09

「Fooocus」による作成

※ 「AIでイラストを作ってみた!美少女コレクション ④「温泉大好き少女たち」」より

「Fooocus」も、ローカル環境へのインストールを前提にしたStable Diffusion系のAIイラスト作成ツールです。

公式サイト:lllyasviel/Fooocus

メリット

  • 無料で使える
  • 外付けのデバイスへインストールしても使える(USBメモリやSDカードでも可)
  • インストールが簡単
  • アダルティなイラストも作り放題♡
  • 4GBのグラフィックボードでも使える
  • XL系のモデルデータを使っているため、とにかく高精細
  • 表現できるイラストの種類がハンパない
  • 絵の解像度を、細部を作り替えながら簡単な手順でスケールアップことが可能
  • すでに作成したイラストの表現をプロンプトだけで簡単に変化できる

「無料で使える・外付けのデバイスで使える・インストールが簡単・アダルティ画像にも対応」などのメリットは、「NMKD Stable Diffusion GUI」と同様です。

なので、ここでは「NMKD Stable Diffusion GUI」にはない、「Fooocus」の大きなメリットを紹介します。

■4GBのグラフィックボードでも使える

「Fooocus」では、グラフィックボードのVRAMは4GB、PC本体の物理メモリは8GBあれば使えるとなっています。

「NMKD Stable Diffusion GUI」に比べるとはるかに敷居が低いですね。

参照:PC Watch/次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」

■XL系のモデルデータを使っているため、とにかく高精細

XL系のモデルデータ(正式には「Stable Diffusion XL」)とは、Stability AI社の開発による画質が大幅に向上した画像生成AI用のモデルデータのことです。

「Fooocus」には、このモデルデータがディフォルトでセットされているため、高精細なAIイラストを作ることができます。

■表現できるイラストの種類がハンパない

「Fooocus」では、今のところディフォルトでセットされているアニメ調やリアル調など5種類のモデルデータしか使えません(2024年1月現在:ただし、更新されるたびにモデルの数が増えているので、今後も期待できます)

その代わり、新たに「スタイル(Style)」という機能で、イラストの表現を変えることができるようになっているのが「Fooocus」です。

つまり、「Fooocus」でのイラスト作成は、「メインのモデルデータ + スタイル(Style)」が基本となっています。このスタイルの種類が、Anime、Cinematic、Photograhic、3DModelなど、驚くことに300種類以上あるのです。

しかも、インターフェースの任意のスタイルにカーソルを持っていくと、どのようなイラストができるのかを絵で表示してくれる親切さです。

このシステムにより、「Fooocus」で表現できないイラストはないといっても過言ではないでしょう。

■絵の解像度を、細部を作り替えながら簡単な手順でアップスケールすることが可能

これについては、言葉よりも実際に絵を見てもらったほうがわかりやすでしょう。以下の絵を見てください。

▼ 「Fooocus」で1024 x 1024の画質で作成したイラスト(神殿跡で舞う女神様)

03

「Fooocus」による作成

▼ 同じイラストを、「Fooocus」のスケールアップ機能で2倍(2048 x 2048)の画質にしたもの

04

「Fooocus」による作成

2つのイラストを比べてもらえれば分かると思いますが、女神様の顔や髪飾り、衣装などがかなり詳細に表現されています(絵をクリックすると拡大します)。

また、背景も、形が整えられたうえに詳細に表現されているのが分かるでしょう。とくに、女神様の左右にある円状の彫刻をみると、上の絵では少し歪んでいますが、下の絵ではなめらかな円になっています。

つまり、「Fooocus」のアップスケール機能は、元の絵の解像度をただ単にアップするだけでなく、デッサンを整え直して、絵そのものを詳細に作り変えてくれるんです

この機能は、「Fooocus」で作った絵だけではなく、読み込むことができる絵なら全てに対応してくれます。

もう一つ、例を見てみましょう。

▼ 「Fooocus」で1024 x 1024の画質で作成したイラスト(神殿跡で舞う女神様)

05

「Fooocus」による作成

▼ 同じイラストを、「Fooocus」のアップスケール機能で2倍(2048 x 2048)の画質にしたもの

06

「Fooocus」による作成

一見、あまり変化がないように見えます。

でも、よく見ると上の絵に比べて、下の絵の女神様が身につけている髪飾りや胸飾りなどに、影やハイライトが細かく追加されてリアリティがアップしているのがわかります。脚にはめている飾りのデザインも、下の絵のほうが細かいですね。

この機能は、とくにキャラクターが小さい時に雑になりがちな顔のパーツへの対応にとても重宝します。

スケールアップ機能の使い方(2倍にする場合)

「Fooocus」のスケールアップ機能の使い方は、とても簡単です。

  1. まず、インターフェースの一番下にある「Advanced」にチェックを入れる。これにより、右側にインターフェースが拡張される。
  2. 拡張されたインターフェースの右上にある項目から「Setting」を選ぶ
  3. すぐ下にある「Performance」は、「Quality」がおすすめ
  4. 「Aspect Ratios」は選択不要(どれを選んでも元画像の2倍の解像度になる)
  5. プロンプトを記入する欄の下にある「Input Imege」にチェックを入れる
  6. 新たに開いたウィンドウ上部の項目から「Upscale or Variation」を選ぶ
  7. 下にあるスペースに、解像度を上げたい絵をドラッグアンドドロップで挿入する
  8. その下にある「Upscale or Variation」の中の「Upscale (2x)」にチェックを入れる
  9. プロンプトを記入する欄の右側にある「Generate」をクリックする

これでアップスケールされたイラストの生成が始まります。少し時間がかかるので、コーヒーでも飲みながらゆっくりと待ちましょう♪

■すでに作成したイラストの表現をプロンプトだけで簡単に変化できる

「Fooocus」のバリエーション機能を使うと、元のイラストの任意の部分をプロンプトだけで変化させることができます。しかも、変化の付け方は「Vary (Subtle)(弱)」と「Vary (Strong)(強)」の2種類から選択可能です。

弱の場合は、元々の構図をわずかに変化させるだけです。でも、強を使うと構図自体も変化する場合があります。

たとえば、下のようにとても幸せそうに笑っている少女のイラストを、弱と強を使って、怒っている表情に変化させてみます。

▼幸せそうに笑っている少女

11

▼「Vary (Subtle)」を使って怒っている表情に変化させたイラスト(弱程度の変化)

12

表情は変化しましたが、ほかはほぼ同じままです(なぜかTシャツのロゴが変化しています)

▼「Vary (Strong)」を使って変化を強くしたイラスト

13

変化の度合いを強くすると、表情ばかりでなくポーズや衣装、背景まで変化しました。かなり激しく怒っています。怖いです。

以上のように、「Fooocus」のバリエーション機能を使うことで、任意の変化をさせることができます。

以下に、もう一例あげておきます。

▼とても素敵な笑顔の少女

14

▼表情だけを、ちょっと危ない感じに変化させました

15

こんなことも可能です。いろいろと試してみたくなる機能ですね♡

バリエーション機能の使い方

1~7までは、スケールアップ機能の使い方と同じです。

  1. まず、インターフェースの一番下にある「Advanced」にチェックを入れる。これにより、右側にインターフェースが拡張される。
  2. 拡張されたインターフェースの右上にある項目から「Setting」を選ぶ
  3. すぐ下にある「Performance」は、「Quality」がおすすめ
  4. 「Aspect Ratios」は選択不要(どれを選んでも元画像の2倍の解像度になる)
  5. プロンプトを記入する欄の下にある「Input Imege」にチェックを入れる
  6. 新たに開いたウィンドウ上部の項目から「Upscale or Variation」を選ぶ
  7. 下にあるスペースに、解像度を上げたい絵をドラッグアンドドロップで挿入する
  8. その下にある「Upscale or Variation」の中の「Vary (Subtle)」または「Vary (Strong)」にチェックを入れる(Subtleが弱でStrongが強)
  9. プロンプトに、どのように変化させたいかを記入する(Google翻訳などを使って英文にする)
  10. プロンプトを記入する欄の右側にある「Generate」をクリックする

しばらく待つと、変化したイラストが生成されます。気に入らなかったら再度「Generate」をクリックして作成し直すか、プロンプトを工夫してみましょう。

以下のブログは「Fooocus」で作成したイラストを使って作っています。これからも、さまざまなテーマで作っていく予定です。ぜひ、楽しんでみてください。

デメリット

「Fooocus」には、あまりデメリットらしいデメリットは見当たりません。しいていうなら、以下のようなものです。

  • 同じプロンプトだと同じような構図が生成されてあまり変化がない
  • 「Styles」の種類が多すぎて、お気に入りを決めるのに時間がかかる
  • 肌についている水系(汗や涙、シャワーの水など)の表現が苦手?
■同じプロンプトだと同じような構図が生成されてあまり変化がない

「NMKD Stable Diffusion GUI」に比べると、同じプロンプトで生成した場合にほとんど同じような構図のイラストになりがちです。

これは、同じテーマでさまざまな構図のイラストを作成しようとすると、そのたびにプロンプトを変える必要があるので、ちょっと面倒かも。

ただし、1枚のイラストを作り込むような使い方をするのなら、このことはデメリットにはなりません

■「Styles」の種類が多すぎて、お気に入りを決めるのに時間がかかる

300種類以上あるスタイルそれぞれに魅力的な特徴があります。どれも捨てがたいスタイルなので、お気に入りを見つけるのに時間がかかります。

でも、これはデメリットというよりも、イラストを作るうえでの楽しみといえるかもしれませんね。

また、これは「Fooocus」の救済措置かもしれませんが、「Fooocus」が推奨するモデルやスタイル、パラメーターがすでにセットされた3つの起動用プリセットが用意されています

それが、「run」「run_anime」「run_realistic」です。

  • run:ノーマルなプリセット(モデルやスタイルを自分で選択するのが前提)
  • run_anime:アニメ調に特化したプリセット
  • run_realistic:リアル調に特化したプリセット

「run_anime」か「run_realistic」を基本として起動し、好みによってモデルやスタイルを変化させると、「Fooocus」はとても使いやすいです♪

■肌についている水系(汗や涙、シャワーの水など)の表現が苦手?

これは、あくまでも「Fooocus」を今まで使ってみた個人的な感想なのですが、水系、とくに汗や涙、それに身体を流れるシャワーの水などが、とても苦手なように感じます。

「NMKD Stable Diffusion GUI」の時点では問題なく表現されているのに、「Fooocus」のバリエーション機能やスケールアップ機能で加工した際に消えてしまいます

プロンプトを追加するなど工夫することで多少は改善されますが、なんとなく、苦手なのかな?という感じですね♪

もしかすると、スタイルによっても結果が変わるかもしれません

追記:涙を表現できるStyleを見つけました!(2024.02.15)

いろいろと試した結果、やっと涙をイメージに近いかたちで表現してくれるStyleを見つけました。「MRE」系のStyleです。

下の絵は、「MRE Cinematic Dynamic」と「MRE Spontaneous Picture」を組み合わせて作ってみました。ちゃんと涙が流れています。感動です!

涙-01

ポイントは、Styleのチェックを「MRE」系のものにだけ入れることです。このときに、「Fooocus Sharp」や「Fooocus Enhance」など、ほかStyleにチェックを入れると、とたんに涙は消えてしまいます

下の絵は、上の例と同じ設定に、「Fooocus Sharp」にもチェックを入れて描きだしたものです。見事に涙が消えてしまいました。

涙-02

ふぅ~、これでやっと、表現の幅を広げることができそうです♪

「NMKD Stable Diffusion GUI」と「Fooocus」を連携して使ってみた

10

「NMKD Stable Diffusion GUI」x「Fooocus」による作成

これは、「NMKD Stable Diffusion GUI」自由度と「Fooocus」高精細の両方を生かせる「いいとこ取り」の使い方です。とくに気に入ってよく使ってます。

具体的には、まず、AIの自由度の高い「NMKD Stable Diffusion GUI」を使って、お気に入りのさまざまな構図・バリエーションのイラストを作成します(512 x 512の低解像度で十分です)

そのあと、そのイラストを「Fooocus」に引き渡し、バリエーション機能の「Vary (Subtle)」(弱)を使ってXLモデルの高精細なイラストに変化させます(1024 x 1024がおすすめ)。

最終的には、スケールアップ機能で2倍の「2048 x 2048」の解像度にアップする、というものです。

例として、実際に作ってみたイラストを以下に紹介します。

▼「NMKD Stable Diffusion GUI」で作成した元のイラスト(512 x 512)

18

▼「Fooocus」のバリエーション機能の弱である「Vary (Subtle)」を使って高精細にしたイラスト(1024 x 1024)

20

▼「Fooocus」のスケールアップ機能で解像度を2倍にしたイラスト(2048 x 2048)

20

ちょっと時間はかかりますが、バリエーションにあふれたとても気に入ったイラストが作れるので、今はこの方法をよく使っています♪

実は、、、、、、

実は、「NMKD Stable Diffusion GUI」と「Fooocus」を使って作成したAIイラストを大量にアップしたサイトを作ってみました。

以下のリンクから行けますので、興味のある方はぜひ、楽しんで見てください。

ただし、ちょっとHなイラストもあるので、閲覧する際は注意です♡

今のところ、「猫耳少女」「美少女」「女神さま」の3つのジャンルがあります。さまざまなテーマでイラストを作っていて、今後も増やしていく予定です。

おわりに

「NMKD Stable Diffusion GUI」や「Fooocus」には、とてつもない可能性を感じます。

とくに、頭の中では「こういうイラストを描きたい」というイメージがあるのに、絵がヘタで思い通りに描けない私のような人間にはとっては、神ともいえるツールです。

手描きのイラストや動画、マンガ、アニメなど、イメージを表現するにはさまざまな方法があります

そして、そのイメージを表現する方法の1つとして、新たにAIによるイラスト作成ツールが登場してきました。

それなら、使わない手はありません。

使い方を工夫してよりよい表現方法を見つけ、AIに協力してもらいながらイラスト作りを楽しみたいですね。

運営者より:Kindle版販売中(Kindleunlimited ¥0)
00-写太郎コレクション
AIイラスト
スポンサーリンク