Stable Diffusion|AIの似顔絵アルゴリズム調査→欠点と賢い使い方を探る

ポク太郎です。

巷で話題のAI画像。やっと爺の耳にも届きました。「AI=万能」と受け取る方も多いですが、本ブログの投稿キーワードでそのAI様に画像を作らせてみました。

試したのは画像生成AIで話題のStable Diffusion


AI画像作成モジュールStable Diffusion

使ってみたAIモジュールがこちら。

フィールドにキーワードとなる英単語を入れて、「Generate Image」ボタンを押すと処理開始。2分~ほどで生成結果の画像を表示してくれます。

結果表示枠の下に「Advanced Option」があり、出力枚数やAI処理のパラメータが調整できるようになっています。

ここでは、試しに本ブログの投稿ネタをキーワードに入れAI画像を出力させてみました。

Stable Diffusionが出力したゲスロ画像

ブラン、成長、劣化

前のAI画像 次のAI画像 

ブランドン・スターク、成長、劣化
キーワード:「Brandon Stark Growth Deterioration
AI image-Game od Thrones Brandon Stark AI image-Game od Thrones Brandon Stark

参考URL→成長後の劣化版ブランスタークにかこつけて、さだまさしと比較投票

劣化という言葉を良く学習しているようです。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOブラン写真 ゲーム・オブ・スローンズ登場人物|シーズン1ブラン・スターク役俳優アイザック・ヘンプステッド=ライトゲーム・オブ・スローンズ登場人物|成長後ブラン・スターク役俳優アイザック・ヘンプステッド=ライト
ブラン役子役アイザック・ヘンプステッド=ライト

ただ、どちらかと言えば“アリアの劣化版”と勘違いしてるような。とはいえ間違いなく“劣化”は理解しております。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOアリア写真 ゲーム・オブ・スローンズ登場人物|アリア・スターク役子役メイジー・ウィリアムズゲーム・オブ・スローンズ登場人物|アリア・スターク役女優メイジー・ウィリアムズ
アリア役子役メイジー・ウィリアムズ

ダーリオ・ナハーリス、俳優変更、不親切

ダーリオ・ナハーリス、俳優変更、不親切
キーワード:「Daario Naharis Actor change unfriendly
AI image-Game od Thrones Daario Naharis AI image-Game od Thrones Daario Naharis

参考URL→ダーリオナハーリス俳優変更を手始めにドラマの不親切度合論じる

明らかに俳優エド・スクラインと俳優マイケル・ユイスマンを足して2で割りました。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOダーリオ・ナハーリス写真 ゲーム・オブ・スローンズ登場人物|ダーリオ・ナハーリス役俳優エド・スクライン変更前シーズン3ゲーム・オブ・スローンズ登場人物|ダーリオ・ナハーリス役俳優マイケル・ユイスマン変更後シーズン4~
ダーリオ役俳優エド・スクラインマイケル・ユイスマン

やはりマイケル・ユイスマンの髭が印象的だったようですね。

エダード、義務責任、苦悩

エダード、義務責任、苦悩
キーワード:「Eddard duty responsibility anguish
AI image-Game od Thrones Eddard Stark AI image-Game od Thrones Eddard Stark

参考URL→義務責任の人エダードスターク人物分析|ネッドの苦悩と矛盾を再度考える

エダード俳優ショーン・ビーンの特徴はまっすぐのまぶた。そこはAIも注目。

Stable Diffusionが学習した俳優と人間による似顔絵
IMDbショーン・ビーン写真 ゲーム・オブ・スローンズ登場人物|エダード・スターク役俳優ショーン・ビーン。愛称ネッド
エダード役俳優ショーン・ビーン

注目は鎧部分。クロスさせる革ヒモは北部の特徴です。ナイツウォッチも同じようにクロス。なんかの画像そのまま持ってきてるんでしょうか。

エドミュア・タリー、意味、登場

エドミュア・タリー、意味、登場
キーワード:「Edmure Tully means appear
AI image-Game od Thrones Edmure Tully AI image-Game od Thrones Edmure Tully

参考URL→何が目的でエドミュアを登場させたのか|名俳優トビアス・メンジーズ

エドミュアセカンドバージョン。俳優トビアス・メンジーズを下膨れにして新キャラ作成です。

Stable Diffusionが学習した俳優と人間による似顔絵
IMDbトビアス・メンジーズ写真 ゲーム・オブ・スローンズ登場人物|エドミュア・タリー役俳優トビアス・メンジーズ
エドミュア役俳優トビアス・メンジーズ

サーセイ、みんな、嫌い

サーセイ、みんな、嫌い
キーワード:「everyone hate Cersei
AI image-Game od Thrones Cersei Lannister AI image-Game od Thrones Cersei Lannister

参考URL→サーセイ嫌いへ贈る『好きになるための自爆リスト』

サーセイなる名前は唯一無二なので、やはり女優レナ・ヘディを引きずっております。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOサーセイ写真 ゲーム・オブ・スローンズ登場人物|サーセイ・ラニスター役女優レナ・ヘディ
サーセイ役女優レナ・へディ

太く吊り上がった眉、黒目が大きいのに鋭い眼光、四角いお顔。この辺りを特徴と捉えたようです。

サーセイ、自爆、理由

サーセイ、自爆、理由
キーワード:「Self-destruct Reason Cersei
AI image-Game od Thrones Cersei Lannister AI image-Game od Thrones Cersei Lannister

参考URL→サーセイの自爆癖分析~見落としポイント詳細まとめ

上項と被りますが、不思議なのはAIが捉える“サーセイ”が安定してこの顔であること。それだけ上の特徴を強く意識してるってことなんでしょうか。

ちゃんと中年オバサンと認識してる点も注目ポイント。

ハウンド、不幸、いいやつ

ハウンド、不幸、いいやつ
キーワード:「Hound Clegane Unlucky The Good
AI image-Game od Thrones hound AI image-Game od Thrones hound

参考URL→ハウンドレビュー|実は道理知るいいやつ?|サンダークレゲイン一人だけ分析

サンダー”をキーワードにしなかったせいかハウンドの丸い目が打ち消されてしまいました。マウンテンが混ざってしまったのかな。

Stable Diffusionが学習した俳優と人間による似顔絵
IMDbロリー・マッキャン写真 ゲーム・オブ・スローンズ登場人物|サンダー・クレゲイン通称ハウンド役俳優ロリー・マッキャン
ハウンド役俳優ロリー・マッキャン

何だか貧相なハウンド。左手に持ってるのは何でしょう?

ジェイミー・ラニスター、無能でない

ジェイミー・ラニスター、無能でない
キーワード:「Jaime Lannister not incompetence
AI image-Game od Thrones Jaime Lannister AI image-Game od Thrones Jaime Lannister

参考URL→ジェイミー・ラニスター|無能とかって感想よくあるが

そのまんまジェイミー。黄金の鎧まで。顔面ホームベースはAIも認めるジェイミーの特徴。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOジェイミー写真 ゲーム・オブ・スローンズ登場人物|ジェイミー・ラニスター役俳優ニコライ・コスター=ワルドー
ジェイミー役俳優ニコライ・コスター=ワルドー

右の鎧は何でしょう。ジャクェン・フ=ガーゲーム・オブ・スローンズ登場人物|誰でもない者ジャクェン・フ=ガー役俳優トム・ヴラシアでも混ざり込んだのかな。

ティリオン・ラニスター、無能

ティリオン・ラニスター、無能
キーワード:「Tyrion Lannister incompetence
AI image-Game od Thrones Tyrion Lannister AI image-Game od Thrones Tyrion Lannister

参考URL→最後まで失策の半人前は本当に優秀?|小鬼インプ

こちらもそのまんまティリオンAIが認めた特徴は、凹んだ鼻頭と膨らんだ眉間、垂れ下がった頬とブルドッグのように飛び出た口でしょうか。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOティリオン写真 ゲーム・オブ・スローンズ登場人物|ティリオン・ラニスター役俳優ピーター・ディンクレイジ。エミー助演男優賞最多三回受賞の小人症
ティリオン役俳優ピーター・ディンクレイジ

結構しっかり認識してるなぁ。

カール・ドロゴ、複雑、陰謀

カール・ドロゴ、複雑、陰謀
キーワード:「Khal Drogo Complicated intrigue
AI image-Game od Thrones Khal Drogo AI image-Game od Thrones Khal Drogo

参考URL→カール・ドロゴ|複雑な陰謀ネタにされるドスラク人脇役

貧相なカール・ドロゴ。野蛮人バーバリアンと繋がったのかな。ヘラクレス的イケメン俳優ジェイソン・モモアの影も形も無くなってしまいました。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOカール・ドロゴ写真 ゲーム・オブ・スローンズ登場人物|カール・ドロゴ役俳優ジェイソン・モモア。ドスラク人族長
ドロゴ役俳優ジェイソン・モモア

右側はアニメ仕立て。ちんこいカール・ドロゴです。

リトルフィンガー、全ての嘘、野望

リトルフィンガー、全ての嘘、野望
キーワード:「Littlefinger all lie ambition
AI image-Game od Thrones littlefinger AI image-Game od Thrones littlefinger

参考URL→リトルフィンガー全嘘とその目的~野望のすべて|ピーターベイリッシュ人物分析

これまた貧相なリトルフィンガー。何でこうなるかな。ただ格闘家や騎士を描かずに黒コートにネクタイとそれなりにリトルフィンガーキャラ。

Stable Diffusionが学習した俳優と人間による似顔絵
IMDbエイダン・ギレン写真 ゲーム・オブ・スローンズ登場人物|ピーター・ベイリッシュ役俳優エイダン・ギレン。通称リトルフィンガー大蔵大臣
リトルフィンガー役俳優エイダン・ギレン

キーワードに『ゲーム・オブ・スローンズ』関連ワードが入ってないにもかかわらず、明らかに俳優エイダン・ギレンを持ってきております。

“嘘”ってワードがリトルフィンガーの代名詞なんでしょうか。

マージェリー・タイレル、不幸な王后

マージェリー・タイレル、不幸な王后
キーワード:「Margaery Tyrell Unhappy Queen
AI image-Game od Thrones Margaery Tyrell AI image-Game od Thrones Margaery Tyrell

参考URL→マージェリー、念願叶えた不幸な王后

マージェリーナタリー・ドーマーと言えば細っいアゴとアヒル口、コメカミを引っ張ったようなウルトラマン。それをこう捉えてしまいました。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOマージェリー写真 ゲーム・オブ・スローンズ登場人物|マージェリー・タイレル役女優ナタリー・ドーマー
マージェリー役女優ナタリー・ドーマー

マージェリーは常に口両脇に力→だからアヒル口、そのまま笑うと頬が膨れ上がってニッ。この辺りは顔面の筋力を想像できないAIが理解できないとこなんでしょうな。

メリサンドル、正体不明、ババア

メリサンドル、正体不明、ババア
キーワード:「Melisandre Unidentified Aunt
AI image-Game od Thrones Redwoman Melisandre AI image-Game od Thrones Redwoman Melisandre

参考URL→メリサンドル|正体不明で消えた自分勝手なBBAを語るスレ

メリサンドルをこう捉えてしまいました。そんなに色白だったかね。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOメリサンドル写真 ゲーム・オブ・スローンズ登場人物|メリサンドル役女優カリス・ファン・ハウテン
メリサンドル役女優カリス・ファン・ハウテン

女優カリス・ファン・ハウテンマージェリーと同じく特徴は口の力の入れ方。アゴが小さいため両脇下に力が入り、下唇を上唇の下へ入れる癖があります。

アゴの小ささを捉えられても“口をとんがらす”動作が理解できないんでしょうなぁ。

赤の女”の赤部分を認識してしまったのか髪の毛とスカーフが同化してしまってます。

ラムジー、拷問、優秀

ラムジー、拷問、優秀
キーワード:「Ramsay Torture Competent
AI image-Game od Thrones Ramsay Snow Bolton AI image-Game od Thrones Ramsay Snow Bolton

参考URL→不快、胸糞悪いに慣れ大嫌いなラムジーに笑わされるゲーム・オブ・スローンズ

Stable Diffusionが学習した俳優と人間による似顔絵
HBOラムジー・スノウ写真 ゲーム・オブ・スローンズ登場人物|異常者ラムジー・スノウ・ボルトン役俳優イワン・リオン
ラムジー役俳優イワン・リオン

特筆すべきことが無いのにチョイスした理由は右の得体のしれない物体。

何を描いたのかは分からないのにそれなりに漫画の構図に納まっています。これぞAIの想像力。

ボロをまとった幽霊か何か?

タイウィン、玉座に就かない

タイウィン、玉座に就かない
キーワード:「Tywin never take throne
AI image-Game od Thrones Tywin Lannister AI image-Game od Thrones Tywin Lannister

参考URL→タイウィンが玉座に就く訳ない理由

タイウィンをこう捉えました。教祖?執事?宣教者?的な。

Stable Diffusionが学習した俳優と人間による似顔絵
HBOタイウィン写真 ゲーム・オブ・スローンズ登場人物|タイウィン・ラニスター役俳優チャールズ・ダンス
タイウィン役俳優チャールズ・ダンス

タイウィンは禿げ上がったイメージないですが、それでもAIの計測は誤魔化せませんでした。年齢という要素はキッチリ捉えるようです。

ハレンの巨城、ドラゴンストーン城、赤の王城

前のAI画像 次のAI画像 

ハレンの巨城、ドラゴンストーン城、赤の王城
キーワード:「Harrenhal DragonStone RedKeep
AI image-Game od Thrones DragonStone harrenhal RedKeep AI image-Game od Thrones DragonStone harrenhal RedKeep

参考URL→ハレンの巨城とドラゴンストーン城|ウェスタロスの最重要拠点

人物ばっかりに偏ってしまったので城を一つだけ。ハレンの巨城はツクツクでない四角い城なのでそちらに引っ張られ、ドラゴンストーン城から崖・海近辺に移動されました。

入力した英語ワードには“城”や“人物”などの指定が無いのに、建物であるか人物であるかは間違いなく認識できています。

Stable Diffusion画像作成のアルゴリズムを探る

Stable Diffusionがどうやって学習してんだろう…と学習原理が気になったのでここからエゴサーチ。これで学習させてみました→ポク太郎 似顔絵。結果が以下。

ポク太郎、似顔絵
キーワード:「pokutaro nigaoe
AI-image AI-image
AI-image AI-image

思いっきりポケモンドラゴンボール。画像内に書かれる文字列は常に無茶苦茶。でも一応“人物イラスト”であることは認識してるようです。

どーもドンピシャ情報からは概念的特徴だけを学習し、カテゴリ的に近い画像にその特徴を入れ込む形で生成してるように見えます。

その判断の根拠は生成された画像の手足が無茶苦茶だから。ポク太郎の描く手はこうなので。

パイレーツ・オブ・カリビアン/PIRATES of the CARIBBEANのジャック・スパロウ/Jack Sparrowの似顔絵カリチュア/illustration。演じる俳優ジョニー・デップ/Johnny Depp フィギュアスケート似顔絵-日本の星!浅田真央トリプルアクセル|イラストカリカチュア

つまり、

Stable Diffusionはポク太郎の絵の特徴を“手足が無茶苦茶”と判定した。

これは名誉棄損案件。

現段階でのAIの正しい使い方と付き合い方

結局、AIてのは現在あるものを真似してるだけ。人間も同じく真似から始めるが、ちょっと違うのは創造物の元になる世界の大きさ。

画像生成でなく自動翻訳で例えますが、“王様と庶民の会話”をAIに翻訳させる場合、以下の概念まで学習しないと不可能→つまり、翻訳作業すらママならず。

  • どちらが王様でどちらが庶民か。
  • 言葉使いにより身の危険が発生する程の身分の違いが存在すること。
  • いつの時代の会話でそこの法律がどうなのか。
  • 王に話しかける庶民は無鉄砲な人物か、そうでないか。

上記は映画見てるだけの人間でも確実に意識してることで、話しっぷりでおおよその見当がつきます。でも現実に現段階のAIは正確な翻訳できておらず。

人間かて同じで、とある高校で流行った“造語”はその環境に入り込まないと理解不能。

若者とは生きる世界も価値観も生物学上の分類まで異なる爺の場合、入り込んでも無理な可能性も→つまり、判断のための条件が絶対的に足りないってこと。

タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ タプ…
これはスラムダンクの世界を知らない人には意味不明な文言。

翻訳一つとってもこれ。

似顔絵の描き方で口の力の入れ方を持ち出しましたが、“筋肉の構成”“力入れる際の感覚と心理的効果”含む人間の全知識学習後でないと創造は不可で、いいとこどりの猿真似が精一杯。

人間自身が解明できてない・言い表せてない“感覚”“感情”からも影響を受けるのが“創造”なので。たかがインターネット上の微小な情報で人間を理解できる筈もありません。

現段階は信じていい情報かそうでないかを必死で分別してるだけ。Stable Diffusionの場合は、上述のように恐らくカテゴリ近隣に概念的特徴埋め込んで“創造”ぽく見せてるだけ。

いずれは出来るでしょうが、想定する未来よりまだまだ先と思います。

つまり、

AIに完成物は作れない。(少なくとも現在は)

自動翻訳の結果を映画の字幕マスターに転用するバカは居ませんので。安モンクサイ量産画像を商品に転用するなら単なるコピー業者だし。

ここでの“完成物”とはこーいう単純作業的なものではないのでご注意→透過PNG、透過GIF作り方|人工知能AIによる背景除去サイト使用の決定版

とはいえ、AIの威力はその圧倒的なスピード。

タタキ台を乱造させるには非常に有効な手段だし、ここでやったようにAIに特定の人物を描かせ2分で特徴を洗い出させられるなら似顔絵作画もスピードアップ。

そこを間違えず上手く使っていければなと思います。

そんなモンよりドット打ちAI作れ

そんな低品質乱造アルゴリズムよりAIに期待したいものが。

それがドット打ち作業。

引用:バンダイナムコエンターテインメント『パックマン』


引用:バンダイナムコエンターテインメント『ディグダグ』

コンピュータの扱える情報量がドンドコデカくなり、“ドット絵”ではなくアニメ画そのものをゲームに使用するよう変遷してきましたが、夢のある“ドット絵”に惹かれる人間は数知れず。

どこぞのキモオタが描いたアニメ画なんぞキモいだけで、価値があるのはドット打ち職人による“ドット絵”。

ただ、そのドット打ち作業があまりに効率が悪く、人間がするには割に合わなすぎる激務でした。

なら、そこにAI突っ込めよとドット絵に惹かれた爺は主張致します。

AI使えば簡単に絵が描ける!と歓喜するのは劣化コピー業者の感情。

前項と同じ結論になりますが、大切なのは“創作活動の助けとなるアルゴリズム”。粗造乱造発想でなく、あくまで創造者が創造するための便利ツール開発に注力して欲しいと考えます。

結局「誰でもできる!」「簡単にできる!」が後ろ向き態度なんよな。己の都合しか目に入らない経団連の能無しジジイ喜ばすだけの。

締めくくりに、どうしてもAIに描いてもらいたかったこちらを→「長州力 ケツ」。

長州力、ケツ
キーワード:「Riki Choshu wrestler buttock
AI-image

プロレスの技は理解できないようです。どうやっても手足が気持ち悪いことになりここには貼れない不気味なのしか出てきませんでした。

長州力のケツに期待しましたが、あまり笑えない締めとなってしまいました。

ゲーム・オブ・スローンズ』が好きな方限定ですが、ポク太郎爺がAIになり切る“人間のAI化企画”実施→ウェスタロスの全英雄|神話・言い伝え整理しイラスト化。何に引きづられその想像イラストを描いたかと理由も付記。
似顔絵とゲームオブスローンズ

コメント

タイトルとURLをコピーしました