AIでのイラスト生成はまだ敷居は高いと思うけど、
ボクがどんな感じにやってるかは紹介しておきます。
【関連記事】
完全素人の適当作業です。やり方おかしいところがあるかもしれないです。
今回使用するSSはこちらです。
StableDiffusionでイラストを生成する場合、学習データなしで生成するのは
ほぼ不可能に近いのでフリーで配布されているモデルデータを使います。
今回はこちらのモデルを使いました。
AnzuMix-(可爱的模特) - v2.0B | Stable Diffusion Checkpoint | Civitai
モデルデータを使うときはライセンスの確認が重要です。
非商用であれば比較的使いやすそうな条件です。クレジット表記も不要です。
StableDiffusionで、クオリティや色合いを決めるプロンプト(きょぬーもしれっと追加)
指や手の間違いを減らすためのネガティブプロンプトを入れて、
「img2img」でSSから変換します。
パラメーターでとくに気を遣うのは「ノイズ除去強度」です。
値を大きくすると、モデルデータの影響を大きく受けた絵が出力されます。
値が0に近づけば変化はほとんどなくなります。
値が大きすぎるとモデルデータの原形をとどめない奇形な化け物に変わっていきます。
ボクは大体0.3~0.55の間で探ってます。 基本は0.4くらいです。
それでは1回目の出力です。
モデルデータの影響はまだ少なめで、顔がSSの面影を残しています。
マビのキャラは肩幅がひろすぎるせいか、
AIが勝手に肩の肌色部分を「手」と認識しはじめています。
今度は先ほど出力された絵をベースにさらに変換を行います。
顔はモデルデータに少し近づきましたがまだSSの面影は残っています。
肩が完全に「手」になってしまいました。
勝手に肩紐をつまむような仕草をしています。
ですが、このままでは腰に当てた腕がおかしなことになってしまいます。
肩側を手にすると判断したなら
GIMPとかお絵かきソフトでざっくり肘(ひじ)を描いてしまうのです。
AIだけに頼るのではなく、AIを誘導するような下絵を作ることが大事です。
今度はこちらの絵からさらに変換を行います。
結果から言えば、最終仕上がりはこちらの絵を基準に調整することになります。
Inpaint機能で直してもいいんですが、今回は使いません。
肘がきれいに仕上がりました。
顔がだいぶモデルデータに寄っちゃいましたね。うさ耳も少し崩れ始めています。
思い切って、「ノイズ除去強度」を0.4から0.47くらいにあげました。
顔はかわいいかもしれませんが、モデルに寄りすぎちゃったので、
SSの個性が損なわれています。
でも、肘、腕、手はかなり高品質な状態になっていますのでこれを使おうと思います。
腕を移植します。
お絵かきソフトGIMPなどで
移植される側の絵にアルファチャンネルを追加して透過PNGにします。
あとは、移植される側と移植する側の絵をレイヤで重ねて、
移植される側の絵の腕を消しゴム(ブラシ)で消していけば、
移植したい腕が浮かび上がってきます。
元が同じ絵なら、たくさんAIで出力して、それぞれの絵の良いところを移植していけば
いい感じに仕上がるかもしれない理論です。
他、微調整して形になりました。
あとは、解像度をあげます。
912x1320の4倍⇒3648x5280で高画質化します。
ノイズ除去強度は0.01にしました。
解像度を上げるだけなので変化させちゃいけないですからね。
MultiDiffsionを有効にして倍率を4倍、アップスケーラーは
R-ESRGAN 4x+Anime6Bを使います。
Tiled VAEはGPUのメモリ不足にならないための保険で有効にしています。
AI出力は少し暗くなる場合があるのでGIMPで色合いを調整して完成です。