Stable Diffusionの「呪文」の与え方

最近はブログにStable Diffusionが生成した画像を出すようにしています。Stable Diffusionなど画像生成AIでは、パラメータとして与えるプロンプトに呪文のようなことを書かないといけないので、呪文詠唱スキルみたいなのが求められるようになってますが、その呪文についてまとめてみます。
というか、ツール使うだけ。

まず、今回の↑の画像の作り方。
最初に、森と城なのでforestとcastleを与えてみるんだけど、ここでfantasy与えておくとよさげな絵になるので付け加えてみます。 「forest, castle, fantasy」で生成するとこんな感じに。

今回fantasyを付け加えたけど、このあたりの付け足すとよさげな単語をいろいろ知っておくというのは割と大変です。

そこでこんなツールが。Stable Diffusionに与えるプロンプトを最適化してくれるツールです。
Microsoft製。これもなんかすごいですね。
https://huggingface.co/spaces/microsoft/Promptist

で、こんなプロンプトにすればいいって言われたのでやってみます。
「forest, castle, fantasy, intricate, elegant, increasingly detailed, digital painting, artstation,」

まあなんか、fantasyが結構効いているので、そんなに変わらない気もするけど、increasingly detailedのおかげか、ちょっとディティールが細かくなってる気がします。実は最初に加えたfantasyも、こうやってpromptistで試すなかで知った単語でした。

じゃあ、ノートパソコン出したい、ということでlaptop pcで試しましょう。
laptop pcだけだとこんな感じ。

Promptistを試すと「laptop pc, ultra realistic, concept art, intricate details, eerie,」というプロンプトをオススメされます。

で、試してみると・・・

お、おう

これ、eerie(不気味)が入ってるからですね。

てことで外して「laptop pc, ultra realistic, concept art, intricate details,」で試すとこんな感じ。

かっこよくしようという気概を感じる!

まあ、生成したいものがはっきりしている場合には、プロンプトは簡素なほうがいい感じになりがちな気がします。

けど、こういった「AI」に与えるパラメータを「AI」で作るというのは面白いなと思います。
Stable Diffusionというのは、ノイズをごちゃごちゃやってるとそれっぽい画像になるという仕組みなのですが、Promptistはパラメータにもノイズを加えるという感じになっていますね。