Withailand (ウィザイランド)

AIの世界に足をそっと踏み入れた

画像生成AIに迷路を作ってもらう

私がまだ保育園や小学校に通っていたとき、私は迷路の本が大好きでした。家にはファミコンと呼ばれていたゲーム機があったのですが、1日で1時間までという家庭内の制限がありましたので、ゲームをやり終えたあとは、絵を書いたり、工作をしたり、迷路の本で遊んだりすることが多かったです。

おじさんになった私もやっていることは大して変わってないかもしれません。仕事が終わったあとはスマホでゲームをすることも多いですし、自分で絵を書くことは少なくなったものの、AIで絵を生成して楽しんでおります。

そんな中、画像生成AIが迷路を生成してくれたら、結構楽しめるのではないかと閃き、試してみることにしました。

今回は、画像生成AIで迷路を生成するチャレンジについてのお話です。

どんな迷路を作るのか

まずは、どんな迷路を作るのかをはっきりさせないといけません。私が作りたい画像は、迷路っぽい画像ではなく、ちゃんと遊べる迷路です。シンプルだけれども、スタートからゴールまでちゃんとたどることができる迷路です。選ぶ道によっては行き止まりに入ってしまうこともあるけど、ちゃんとゴールまで行ける道のりがある迷路を簡単にAIに作ってもらいたいのです。

プロンプト(呪文)を考える

では、シンプルでちゃんと遊べる迷路の画像を作るにはどのようなプロンプトを使えばいいのでしょうか。プロンプトを書くにあたり、まずは【迷路】を英語で何と言うのかをわかっていないとはじまりまりません。

調べてみたところ、【迷路】を表す英単語は、【maze】と書くようです。マゼではなくてメイズです。この【maze】をプロンプトの中に入れて画像を生成してみます。以下のようなプロンプトでやってみることにしました。

simple maze, white background and black lines, bold lines, 2D

プロンプトは以下のような思いを込めて言葉をえらびました。

  • simple maze → シンプルな迷路
  • white background and black lines → 白い背景に黒い線
  • bold lines → 太い線
  • 2D → 平面

WOMBO Dreamで生成してみる

まずは、生成が早くて操作がシンプルなWOMBO Dreamを使って試しに生成してみました。4種類のart styleを使ってみました。

どれも迷路っぽい画像が生成されました。

【Dreamland v2】は、なかなか良い出来栄えです。平面ですし、シンプルです。しかしながら、外枠がないために開放的すぎて、迷路として遊ぶにはあと一歩足りない感じです。

【Mechanical v3.1】と【Mechanical v3.0】は、ともに2Dというプロンプトを無視して、立体的になってしまいました。迷路をモチーフとしたイラストといった感じです。

【Ukiyo-e v3】は、平面で細かくて、一見緻密で難しそう迷路に見えますが、よく見ると遊ぶことはできません。

WOMBO Dreamでは、迷路っぽいイラストや模様を生成することは、そんなに難しくありませんでした。しかしながら、実際遊ぶことができる迷路を生成することは、今回できませんでした。

PixAI.Artで生成してみる

次は、PixAI.Art(以後、PixAIと書きます)で生成してみました。PixAIでは、一回のオーダーで4枚まで同時に生成できるので、その機能を利用しました。条件は以下ようにしました。

・プロンプト:上記のもの

・ネガティブプロンプト:worst quality, large head, low quality, extra digits, bad eye,  EasyNegativeV2,  ng_deepnegative_v1_75t

・Sampling Steps:50

・Sampling Method:DDIM

・CFG Scale:11.0

・縦横比:426✕426

其の一:Coloring Page Creator

まずはColoring Page Creatorというモデルを使って生成しました。このような出来栄えです。

どれも平面的な迷路っぽい画像が生成されました。

細かく見ていくと、左上の画像は迷路の壁の部分が短すぎてスカスカな印象です。これでは迷路として遊ぶことはできません。

右上と左下の画像は、迷路っぽいですが、壁が道を区切りすぎていて、これも迷路として遊ぶことはできません。

右下の画像は、シンプルで壁と道の区別もしやすく、スタートとゴールの位置をうまく決めれば遊べそうです。

其のニ:Chibi Style 1.1

次はChibi Style 1.1というモデルを使って生成しました。このような出来栄えです。

先ほどのColoring Page Creatorというモデルを使ったときよりも緻密な迷路になりました。そして、4つともデザイン性が高いです。

左上の画像は、分岐路が少なくて迷路として遊ぶのには物足りないように感じます。

右上の画像は中心部のあたりで通路と壁の区別が付きづらくなり遊べません。

左下の画像は、デザイン性も良くて道と壁のの区別もしやすく、分岐路もそこそこありますので、スタートとゴールの位置をうまく設定すれば、遊べそうです。

右下の画像は、外枠がなくて開放的過ぎますし、何箇所か道と壁の色が混ざってしまっているので、遊べません。

LoRAを作ってみる

私が考えたプロンプトを入力すれば、Coloring Page CreatorにしてもChibi Style 1.1にしても、1/4くらいの確率で遊べそうな迷路の画像が生成できそうです。

でも、もっと精度を高めたい気持ちも出てきました。そこで、シンプルな迷路に特化したLoRAをを作ってみようと思いました。自分で作成した以下のような迷路画像を14枚使ってLoRAを作りました。

PixAIでのLoRAの作り方は、以下の記事でご紹介しております。

手軽にオリジナルのLoRAを作ってみよう(https://senisthousand.hatenablog.com/entry/original_lora)

迷路画像LoRAの作成にあたり、今回の設定は以下のようにしました。

・LoRAタイプ:アートスタイル

・LoRA名:simple maze

・トリガーワード:maze

・ベースモデル:Anything V5

このLoRAはPixAI.Artの中のモデル検索で『simple maze』というキーワードで検索すると出てくるはずです。よかったら試しに使ってみてください。

↑このようなモデル表紙になっております。※モデルではなくLoRAです。

作ったLoRAを加えて生成してみる

それでは、出来上がったLoRAを使用して先ほどと同じ条件で生成し直してみます。LoRAの比重は7.0にしました。

其の一:Coloring Page Creator

LoRAの影響で、太くて黒い色の壁の迷路っぽい画像が生成されました。どの画像も、迷路のようでいて迷路ではないというのが私の初見の感想です。区切られてブロック化されてしまい、道が分断されているのです。これでは迷路として遊ぶことはできません。

其の二:Chibi Style 1.1

LoRA無しのときと比べると、平面的で四角い迷路風の画像が生成されました。しかしながら、どの画像も遊ぶための迷路とは言えず、迷路っぽい画像止まりの印象です。

結論

この記事を書くにあたり、PixAIでたくさん迷路の画像の生成に取り組みましたが、迷路っぽい画像は生成されても、ちゃんと遊べるような実用的な迷路画像を生成することはできませんでした。この記事で紹介した画像以外にもたくさん生成していたのですがどれも失敗作です。

シンプルな白黒の平面的な迷路画像を自分で用意して、オリジナルLoRAを作りましたが、それを使ってもちゃんと遊べるような迷路は生成できませんでした。

画像生成AIは、見た目上では迷路のような画像を生成することはできても、迷路ゲームの内容や遊び方を理解することはできないようで、ちゃんと遊べる迷路を作ることはできないのです。

しかしながら、PixAIやWOMBO Dreamのような画像生成に特化したAIではなく、もっと総合的な人工知能や迷路生成に特化したプログラムだったら、いとも簡単に迷路ゲームを作ってしまうことでしょう。

おまけ

迷路を作るために、私がPixAI上で作った『simple maze』というLoRAでは、遊べる迷路を生成することはできないことがわかりましたが、白と黒を基調とした迷路っぽい模様を生成することはできることがわかりました。その模様をぼんやりと見ると、元BOΦWYの布袋寅泰さんのギターの模様に若干似ているような気がしなくもないです。今度は布袋さんのギターっぽい画像を生成する挑戦をしてみようかなと思いました。

更新履歴

  • 2024年4月19日:記事の概要を追加