生活魔法としてのAI画像生成には、呪文より錬成手順が大事かも

Stable Diffusion楽しいですね。こんな画像が生成できました。

ちなみに「呪文」はこんな感じです。

Silver fairies home madeup of flowers, magical world, by greg rutkowski, sung choi, photo realistic, 8 k, cinematic lighting, hd, atmospheric, hyperdetailed, trending on artstation, devainart, digital painting, glow effect

ここで紹介されたものを使いました。
https://ponkichi.blog/stable-diffusion-prompt/

ミュシャっぽい絵もだしてくれますね。

「呪文」はこんな感じ。上のサイトで紹介されていたものの先頭にmuchaをつけています。

mucha, Rococo and art nouveau fusion, iridescent diaphanous refractive and reflective flower bouquet, fantasy, intricate, elegant, highly detailed, digital painting, artstation, concept art, matte, sharp focus, illustration, hearthstone, art by artgerm and greg rutkowski and alphonse mucha

こうやって、「呪文」をどんどん調整することでいい絵はできるわけだけど、実際にここまで「呪文」を考えるのは大変です。
そして、実際にStable Diffusionを使うのは何かに埋め込むちょっとした画像を生成したいだけだったりするので、単独でSNS映えするかっこいい画像は不要だったりします。
ドラゴンと戦える極大魔法を唱えたいのではなくて、ちょっと暮らしが便利になる生活魔法が欲しいのです。

といった場合には、「呪文」を考えるよりも手順をひとひねりするほうが楽です。錬成が大切。

たとえば、なんかロボットの画像が欲しいとする。そこでまずtransformerだけ与えて画像を生成します。

色がトランスフォマーっぽい

コンボイさんも出ますね。

で一番ロボットぽいのがでた

そうやってイメージに近いものが出たら、その画像をちょっと修正します。草原と青空背景にしたいので、後ろを青と緑で雑に塗ります。ロボットにはみ出すくらいでよいかと。

この修正画像を初期画像に設定して、transformer, ricefield, steampunkで出力するなかでいい感じの画像が出てきてくれます。steampunkとかdieselpunkとかは機械の画像生成をいい感じにやってくれます。

さらにその画像を初期画像に設定して、同じくtransformer, ricefield, steampunkで生成しなおします。こちらのほうがフィールドに影がついてていいかな。

こうやって、単純なキーワードで画像を生成して、修正してヒントにしつつキーワードを少し増やして画像を生成、さらに近づいた画像をヒントに別の画像を生成する感じです。
AI画像生成では2つの主題をなかなかうまく生成してくれないので、最初はひとつのキーワードで生成して、そこをヒントにもうひとつのキーワードを指定する感じ。

他の例としてもうひとつ、街中のものを生成したいとします。
ということで今回は背景を雑に灰色で塗ります。

その画像を初期画像に設定してtransformer, broken building, dieselpunkあたりで生成するとなんかそれっぽいものが。

その画像を初期画像にして、さらにtransformer, broken building, highly detailed, photo realisticあたりで生成。

まあ、これでよくなったかどうかは別として、なんとなく近づけていく方法がわかった気がする。