github
GitHub - suzaku-tec/StableSpellWizard
経緯
性能高いPCに買い替えて、Stable Diffusionで遊んでいたが、呪文作るのが面倒くさくなって作った
使ってるモデル
Anything v3
使い方
node環境作れる前提で説明してる。
詳しくは、readme読んで
使い方の簡単な説明をすると、word.jsonに記載されているワードをペタペタ貼り付けて、リストを作り、クリップボードにカンマ区切りでコピーしてくれる。
コピーしたやつを、txt2imgタグの各テキストボックスに貼れば、意図した内容で出力してくれるはず。
例
下記の画像は、誰かをイメージして、呪文を生成しました。
さて、一体誰でしょう?
正解は、 兎田ぺこら
似てはいるけど、本人ではないな。。。
ただ、ワードを選ぶだけで、それなりの画像が出せる。
あと、アニメ絵は、全体的に胸が大きめに出てきやすい。
カスタマイズ
word.jsonがキモなので、それを編集して単語を登録しておけば、基本的に何でも行ける。
ただ、俺のブランドイメージのため、過度なエロワードは入れてない。
なので、ローカルに落としたら、各自で編集して使って。
感想
結構思い通りのものができて満足。
これは、以下に自分のイメージを言語化できるかが問題だろうな。
頭の中でイメージして、特徴にあったワードを選ぶと、いい仕事してくれる。
具体的にいるキャラだとイメージしやすい
今後の展望としては、word.jsonを加筆・修正していって、思うようなキャラを出せるようにしたい。
もしくは、もっと精度の高いワードがあれば、それを利用するなど
なんか、良いモデルが他にないか調べてるんだけど、Anything v3が一番しっくり来てる。
実写は、たまにホラー写真みたいなのが出てくるから、やる気が出ない。
あと、使ってて思ったのが、ネガティブワードは、重要ってこと。
たまに、手が3本だったり、下半身が途中で切れてたりするので、それが出ないようにネガティブワードを指定している。
今まで使って来たけど、黒髪キャラが好きなんだなって、思った。
生成した画像がローカルファイルに保存されてるんだけど、過去生成したやつを順番に見ていったら、黒髪率の高さが異常。