エンターテイメント!!

遊戯王好きのJavaエンジニアのブログ。バーニングソウルを会得する特訓中。

Stable Diffusionの呪文生成器を作った

github

GitHub - suzaku-tec/StableSpellWizard

経緯

性能高いPCに買い替えて、Stable Diffusionで遊んでいたが、呪文作るのが面倒くさくなって作った

使ってるモデル

Anything v3

使い方

node環境作れる前提で説明してる。
詳しくは、readme読んで

使い方の簡単な説明をすると、word.jsonに記載されているワードをペタペタ貼り付けて、リストを作り、クリップボードにカンマ区切りでコピーしてくれる。
コピーしたやつを、txt2imgタグの各テキストボックスに貼れば、意図した内容で出力してくれるはず。

下記の画像は、誰かをイメージして、呪文を生成しました。
さて、一体誰でしょう?

正解は、 兎田ぺこら

似てはいるけど、本人ではないな。。。
ただ、ワードを選ぶだけで、それなりの画像が出せる。

あと、アニメ絵は、全体的に胸が大きめに出てきやすい。

カスタマイズ

word.jsonがキモなので、それを編集して単語を登録しておけば、基本的に何でも行ける。
ただ、俺のブランドイメージのため、過度なエロワードは入れてない。

なので、ローカルに落としたら、各自で編集して使って。

感想

結構思い通りのものができて満足。

これは、以下に自分のイメージを言語化できるかが問題だろうな。
頭の中でイメージして、特徴にあったワードを選ぶと、いい仕事してくれる。
具体的にいるキャラだとイメージしやすい

今後の展望としては、word.jsonを加筆・修正していって、思うようなキャラを出せるようにしたい。
もしくは、もっと精度の高いワードがあれば、それを利用するなど

なんか、良いモデルが他にないか調べてるんだけど、Anything v3が一番しっくり来てる。
実写は、たまにホラー写真みたいなのが出てくるから、やる気が出ない。
あと、使ってて思ったのが、ネガティブワードは、重要ってこと。
たまに、手が3本だったり、下半身が途中で切れてたりするので、それが出ないようにネガティブワードを指定している。

今まで使って来たけど、黒髪キャラが好きなんだなって、思った。
生成した画像がローカルファイルに保存されてるんだけど、過去生成したやつを順番に見ていったら、黒髪率の高さが異常。