Withailand (ウィザイランド)

AIの世界に足をそっと踏み入れた

モグラのイラストをAIで描く

私は最近、ロマサガ2(ロマンシング・サガ2)というロールプレイングゲームで遊ぶことが多いです。

あなたはロマサガ2をご存知ですか?元々はスーパーファミコンのソフトだったので、世代によってはある程度認知されているかもしれません。世代が合ってない方の場合ですと、古いゲームが好きな方でないと知らないかもしれませんね。

そのゲームでは、途中でモール族という二足歩行のモグラ土竜)みたいな見た目の地底人が登場します。そのモール族はゲームを進めていくと仲間にすることができます。土の術が得意で、状態異常を引き起こす攻撃にも耐性があるので、私はこのモール族を頻繁にパーティーの中に入れております。頻繁にパーティーに入れているので、愛着も湧いてきました。見た目は二足歩行のモグラですが、ファッションにはこだわりがあるようで、丸眼鏡をかけてキャスケット帽を被り、前開きのベストも着用しております。そんな個性的なキャラクターなので、私はそのモール族をAIを使ってイラストを生成してみたくなりました。ところが、やってみると想像以上に難しかったのです。まず、普通のモグラの画像を生成することがとても難易度が高いのです。

さて、冒頭は散々ロマサガ2のモール族の話をしましたが、今回の記事は、モール族の話ではなく、画像生成AIを使ってモグラのイラストを描くことについてお話させていただきます。

モグラのプロンプトを考える

私は、普段PixAI.Art(以降、PixAIと記載します。)を使って画像生成をしておりますが、AIに画像の生成を依頼するときは、どんな画像を生成してほしいのかをプロンプトにして指示する必要があります。なので、まずはじめにモグラを描いてもらえるようなプロンプトを考えなければいけません。私のプロンプトの決め方は、生成したいモチーフを英単語にしてみるということが、ファーストステップになります。モグラを英語で表すとmoleです。このmoleという英単語をプロンプトにしてPixAIで画像を生成してみると、以下のようなイラストが出来上がりました。

図1

図1の通り、4枚とも哺乳類のような画像ではあるのですが、どう見てもモグラではありません。やっぱり土を掘る大きな手と爪がないとモグラっぽくないですよね。強いて言うなら右上の画像が少しモグラっぽいかなとも思えますが、AIさんのモグラについてのお勉強はまだまだ不足しているようです。

ちなみに図1の画像を生成したときの設定は以下のようにしておりました。

・モデル:Anything V5

・LoRA:不使用

・プロンプト:a mole

・ネガティブプロンプト:worst quality, large head, low quality, extra digits, bad eye, EasyNegativeV2, ng_deepnegative_v1_75t

・Sampling Steps:25

・Sampling Method:DPM++ 2M SDE Karras

・CFG Scale:11.0

・縦横比:426 x 426

大きな手と爪

「さては、モグラってどんな生き物なのか知らないな。」と、AIさんに問いたくなるような画像だったわけですが、足りない要素である大きな手と爪はなんとか映させてほしいところです。ここはプロンプトの調整でどうにかしていこうと思いました。設定は変えずにプロンプトだけを変更しました。

プロンプト:there is a mole which has big hands and nails

その結果、このような画像が生成されました。

 

図2

これは完全に失敗ですね。アニマル的な要素がほぼゼロです。でっかい豆を指でつまもうとしている人のようです。そして画像生成AIでありがちな指の本数が5本ではない現象も出ております。なんだかモグラよりも大きな手という指示に引っ張られすぎているようです。a moleだけのプロンプトのほうが断然良かったです。手のことをhandsとしてしまったのがいけなかったのかもしれません。それなので、handsではなく前脚を表す単語に変えてみました。front pawsです。それと、人間の手が入ってしまうのも直したいので、without human beingsとwithout peopleというのもプロンプトに入れてみました。まとめると、以下のようなプロンプトです。

a mole, it has wide front paws and long nails, without human beings, without people

そのようにして出来上がった画像が下の図3です。

図3

見事にモグラとは程遠い哺乳類の画像が出来上がりました。もはやこのAIはモグラを知らないとしか思えません。

次なる修正

私は、図3の哺乳類をモグラに近づけるために、さらにプロンプトに手を加えようと思いました。それなので、どこがモグラと違うのかをよく考えてみました。以下のような手を加える必要がありそうです。

  • もっと幅広い前脚にしたい
  • 耳を無くしたい
  • 吻(ふん)を長くしたい
  • 目をほとんど無くしたい

これをプロンプトに表してみようと思いました。なので、以下のようなプロンプトにしてみました。

(a mole, it has wide front paws and long nails:1.7), degenerate ears and eyes, long snout, without human beings, without people

すると、下の図4のような画像が生成されました。

図4

これもうまくいきませんでした。

他の動物はあっさりと生成できる

こんなにモグラのイラストを生成する事が難しいとは思いませんでした。ここまで難しいと、他の動物はどうなのか気になってきましたので、確かめてみました。詳細設定は変更しないで、プロンプトだけを違う動物に変えてオーダーしました。誰でも知っている哺乳類を4種類ほど試してみました。犬,猫,キリン,象です。

1つ目は犬です。プロンプトはシンプルに、

a dog

だけでやってみました。

 図5

図5の通り、お利口そうなワンコがばっちりと生成されました。

次は猫です。プロンプトはこれもシンプルに、

a cat

のみです。結果は下の図6です。

 図6

これも成功です。誰がどう見ても黒いニャンコです。猫らしいヒゲも再現されております。

次は、犬や猫よりは人間と関わり合いの少ないキリンでやってみました。プロンプトは、

a giraffe

だけです。アフリカ大陸以外では動物園やサファリパークみたいなところにしかいないような哺乳類てすから、モグラよりも身近ではない動物なので、これは少し難易度が高いのではないかと思いました。結果は以下の図7のイラストです。

 図7

ちゃんとキリンのイラストになっております。よく見ると角の部分はなんか違うのですが、それ以外の部分がキリンらしさを表しているので、これはばっちりキリンに見えます。

そして、4つ目は象です。こちらもプロンプトはシンプルに、

a elephant

だけでやってみました。下の図8がそのイラストです。

 図8

これもちゃんと象のイラストが生成されました。

このように、有名な動物は単純なプロンプトだけでも結構あっさりとそれらしい画像ができあがるのです。

知名度の問題なのか?

何故、犬や猫やキリンや象はちゃんと生成されるのに、モグラはうまくいかないのでしょうか。知名度の問題なのでしょうか。

知名度を正しく計れるわけではありませんが、Yahoo!JAPANの検索を使って、どれほどインターネット上にそれぞれのキーワードが扱われているのかを調べてみようと思いました。犬,猫,キリン,象,モグラを英単語に置き換えて、それをYahoo!JAPANの検索窓に入力し、検索をかけました。そして、それぞれのキーワードに対しての検索にヒットする記事の数を調べてみました。(この調査は2024年9月4日に実施したものです。)

 表1

結果は表1のようになりました。わかりやすくランキングにしてみると、

  1. cat(猫)…約6,270,000,000件
  2. dog(犬)…約4,850,000,000件
  3. mole(モグラ)…約678,000,000件
  4. elephant(象)…約649,000,000件
  5. giraffe(キリン)…約139,000,000件

という並びになりました。

犬(dog)と猫(cat)が圧倒的に多いですね。肝心なモグラ(mole)はどうかというと、動物園の人気者の一つであるgiraffe(キリン)を完全に凌駕しております。そして、これまた動物園の人気者の一つであるelephant(象)を相手にしても、僅差ではありますが上回っているという事に驚きました。

moleの他の意味

私個人の感想としては、象やキリンよりもモグラはマイナーな動物だと思っておりました。しかしながら、検索に引っかかる件数は、象やキリンよりも上という事実がありました。それにしては、moleはAIによる画像生成の精度は極端に低いです。moleにはAIを惑わす何かがあるのではないかと思い、moleを逆に英和辞典で日本語に直してみました。すると、moleにはモグラという意味の他にも、かなり一般的な意味があることがわかりました。

それは【ほくろ】です。

それを知った上で、図1,図3,図4を振り返ってみますと、確かに画像の中に黒い点が所々に描かれておりました。

まとめ

ここまでPixAIでモグラの画像を生成する事を頑張ってみましたが、上手く生成することは結局できませんでした。モグラのイラストをAIで描くことは、ここで一旦諦めようと思います。

私の考えとしては、以下のようなような状態なのではないかと思います。

  • PixAIで使用されているAIでは、まだモグラという動物の基本データが不足しているようだ。
  • PixAIで使用されているAIでは、モグラはネズミのような小動物という認識が強いようだ。
  • PixAIで使用されているAIでは、moleという単語をプロンプトにすると、小動物かほくろか迷ってしまうようだ。

今回、PixAIでモグラが上手く生成できないという現象を目の当たりにして、まだまだAIにもできないことがあるのだという事がわかりました。これは画像生成するAIだけでなく、chatGPTやGeminiやClaudeのようなAIチャットツールにも言えることだと思います。AIチャットツールが幅広くて正確な情報を生成するのには、実体験を伴った生身のWebライターの力がたくさん必要なのではないかと思いました。私もささやかながらブログで記事を書いている一人ですので、少しでも役に立てるような確かな記事を書いていきたいと思いました。

続編について

この記事中では、モグラのイラストは上手く完成させることができませんでしたが、その後、違うAIを利用することでモグラのイラストの生成に成功しました。2024年9月12日に、その事についての記事を書きましたので、そちらも是非ご覧ください。↓

続・モグラのイラストをAIで描く(https://senisthousand.hatenablog.com/entry/mole2)

更新履歴

  • 2024年9月7日:#モグラ #AI #イラスト のタグを追加
  • 2024年9月12日:続編についてを追加