オリジナル AI アートに関するブログです.AIアートをつくるときは通常,英語でこまかい記述をプロンプト (呪文) としてあたえますが,そうせずに,みじかい造語や絵文字だけをつかって,AI に自由にアートをつくらせています.
このサイトでは,プロンプトとしてできるだけ短いことば,通常は 1 単語だけをあたえて,画像 AI とくに Stable Diffusion に自由に「発想」させた絵画風の画像を掲載しています. このミニマリズム的な方法を Minimal Words AI Painting (MWAIP) とよぶことにしました. この記事では短いプロンプトから多様な画像をえるための方法として,プロンプトから文字を削除したり追加したりする方法と, 負のプロンプトに正のプロンプトとおなじことばや関連することばを指定する方法について書きます.
自由な発想によってどんどん多様な画像をつくらせるためには,AI にあたえる指示は単純なほうがよいとかんがえています. つまり,みじかいプロンプトをくりかえしつかうようにしています. たとえば,画家のなまえをあたえるだけで目的が達せられるときには,そのようにしています. トゥリオ・クラーリという 20 世紀の画家 (生没年 1910-2000) がいましたが,そのなまえ (Tullio Crali) をくりかえしあたえるだけで Stable Diffusion 1.5 はクラーリとは作風がちがうさまざまな画像をうみだしました. その例をあげます.
つまり,クラーリの場合にはなまえをそのままあたえるだけで興味ぶかい画像がえられ,また,ほどよい多様性がえられました. このようにみじかいことばだけで画像をつくらせるのは一種のミニマリズムだとおもいますが,そういう手法に MWAIP (Minimal Words AI Painting) というなまえをつけて,それをサイトのタイトルにつけてみました.
おなじプロンプトをくりかえしつかうことでことなる画像が生成されるのは,AI に乱数をあたえているからです. 乱数はいわゆる偶然性 (chance) のための手段であり,ジョン・ケージやクセナキスなどの 20 世紀の作曲家がつかってきました. AI アートの場合は乱数の使用が最初からくみこまれていますが,MWAIP ではそれを多様化のための手段としてつかっています. あたえる乱数を変えて何度も画像をつくらせても,長いプロンプトをあたえた場合は画像の多様性はかぎられています. しかし,短いプロンプトをあたえる場合には,画像をくりかえしつくらせるとによって比較的多様な画像がえられます.
プロンプトの文字数などを変えることで多様性あるいは偶然性を調整することができます. 通常,画像 AI にはプロンプトをあたえずに画像をつくらせることはできませんが,プロンプトは最低限 1 文字あれば画像を生成することができます.そのため,1 文字の英数字だけで画像を生成することもこころみています (1 文字の英字による例を「AI に 1 文字のアルファベットをあたえるだけで描く魅力的な絵」,数字による例を「AI が数字で描く植物たち,そして人」にあげています). しかし,1 文字のプロンプトでは制約がゆるすぎて,かならずしもほしい画像がえられません. 通常はもうすこし制約をかけてやる必要があります (2 文字の英字による例を「AI に 2 文字のアルファベットをあたえて描くとき,「AQ」がとくに魅力的」,2 文字以上の数字による例を「AI が数字で描く植物たち,そして人」にあげています). つまり,もうすこし長いプロンプトをつかう必要があります. これは,プロンプトを調整して偶然性を管理しているということです.
20 世紀音楽においては「管理された偶然性」ということばがつかわれましたが, それに類似したことをここではプロンプトを調整することによって実現しています. ただし,20 世紀音楽においては乱数から直接,音がつくられたのに対して,ここでは乱数が AI に「自由」をあたえるためにつかわれているという点において,おおきなちがいがあります.
通常,プロンプトを調整するにはことばを足していきますが,それによって画像は限定されてしまいます. MWAIP では多様性を維持しながらプロンプトを調整する方法をくふうする必要がありました. クラーリの場合は乱数の数値を変えて何度も画像をつくらせるだけでうまくいったわけですが, あたえることばによってはそれだけでは似たような傾向の画像ばかりがえられることもあります. たとえばカンディンスキー (Kandinsky) の場合がそうでした. カンディンスキーが描いた絵とくらべると,あまり興味をひかない似たような画像が多くえられました. そういう場合には多様化をうながす手法が必要です.これまでためしてきた方法としては, 正のプロンプトの一部を変更する方法と,負のプロンプトをつかう方法とがあります.
プロンプトの一部を変更するには,そこから文字をけずっていく方法と,そこに文字を足していく方法とがあります. まず文字をけずる方法について書きます. プロンプトによっては先頭や末尾の文字をけずるとまったくちがう種類の画像がえられることもありますが, あまり変化がなかったり,共通点がある画像がえられたりすることがあります. 変化がすくない場合にはさらに文字をけずっていきます. “Expressionism”,“Impressionism” の場合には,先頭から 2 文字けずるとどちらも “Pressionism” という造語になりますが,それを AI にあたえると,“Expressionism” や “Impressionism” と同様に,ゆたかな絵画風の画像がえられます. 詳細は「AI が “...ssionism” で描く多様な画像」に書いていますが,ここにもすこし例をあげます. まず “Expressionism” と “Impressionism” でえられる画像の例を 1 枚ずつあげます.
1 文字けずって “Pressionism” にしてえられる画像の例を 2 枚あげます.
これらの画像は “Expressionism” からえられる画像のほうに似ていますが,もっと何枚もみていくと それともちがう部分があることがわかります.
さらに文字をけずっていくと “Ressionism”,“Essionism” となりますが,AI はそこから,それぞれややおもむきがちがう興味ぶかい画像をうみだします. これもすこし例をあげておきます.
画像のちがいはここにあげた絵だけ見ても感じられるようにおもいます.
つぎに文字を付加する方法について書きます. プロンプトの先頭または末尾に英字を 1 文字追加すると,まったくちがう種類の画像がえられることもありますが, 共通点がある画像がえられることもあります. 数字の場合は,通常は足してもその影響は限定的であり,多様性をうながす方法としてつかいやすいとかんがえています. たとえば “ressionism” の先頭に 1 文字追加して “gressionism” にすると,つぎのような画像がえられます.
おもに左の絵のような建物がある風景を描きますが,右の絵のような人物画や抽象画も描きます. いずれも “ressionism” の図柄とはだいぶちがいますし,“expressionism” や “impressionism” からえられるものとはさらにちがいます.
付加する文字を変えて “bressionism” にすると,つぎのような画像がえられました.
これは上記のどのつづりからえられる絵ともかなりちがいます.
“gressionism” や “bressionism” ですでにためしたように,文字の削除と付加はくみあわせることができます.
プロンプト・エンジニアリングにおいて負のプロンプトにはあまり積極的なやくわりがあたえられていないようにおもいますが, それをうまくつかうことによって多様性を拡大し,興味ぶかい絵をつくることができます.
たとえば,「“否定” すると一段と魅力的な AI アートがえられるカンディンスキー」に書いたように,“Kandinsky” という語を正のプロンプトだけにあたえて生成をくりかえしても同様のスタイルのえばかりがえられますが, それを負のプロンプトにもあたえると多様な絵が描かれます.ここには 2 枚だけ例をあげますが,上のページにはもうすこし例をあげています.
“Kandinsky” を正のプロンプトとしてだけあたえると似たような抽象画ばかり描く AI が,それを負のプロンプトにもあたえると描く抽象画のスタイルが多様化し,人物画や風景画も描きます. 負のプロンプトが AI にどのように作用しているのかよくわかりませんが,おそらくそのプロンプトがもつ中心的な部分がよわめられて, 周辺的な部分が強調されるのではないかとおもいます.
さらに,負のプロンプトとして “expressionism”,“impressionism”,“abstraction” などのことばをあたえても,単に画風をシフトさせるだけでなく多様性も増しているようにおもわれます. つぎの 2 枚は負のプロンプトとして “abstraction” をあたえたものです.
抽象を禁じてもまだ抽象画も描きますが,より具象的なものにちかづき,人物などがよく描かれるようになります. このように関連する語を負のプロンプトにあたえて高価がえられるのは,正のプロンプトがもつもののうちの一部, つよい部分がよわめられて,やはり周辺的な部分が強調されるためではないかとおもいます.
ここでは “Kandinsky” という画家名を例にとりましたが,ほかの画家ではもちろん,“Expressionism” のような実在の芸術運動名,“Pressionism” のような造語された芸術運動名においても同様の効果があることは 「芸術運動名を “否定” することで多様化する画像」に書いたとおりです.