【AIとアート入門】前編:「コンピュータは創造的か」の問いに私たちはどう答えるか? レフィーク・アナドールから近年の研究事例まで(講師:久保田晃弘)【特集:AI時代のアート】
AIがもたらすのは「新たな鑑賞のパラダイム」
──現在のAIをめぐる状況を面白く感じました。これまで人文学は科学に一方的に憧れていて、逆に科学領域にとっては人文学の知は取るに足りないものだというイメージを持っていましたが、両者が手を組むことを考えるとわくわくします。 久保田:現在のAI技術でも、とりあえずはアナドールの《Unsupervised》のように、様々な画像を生成することはできるのですが、僕はこうした生成よりもむしろ鑑賞のパラダイムが機械学習によってどう変化するのかを考えることが必要だと思っています。 鑑賞というのは、これまで「何度も繰り返し見る」「じっくり見る」という、人間的、身体的なトレーニングに根ざしていました。しかし通信やデータベースの容量が飛躍的に増大したいまの時代に、いかにして世界を見るかが、様々な分野で深刻な問題になりました。『遠読:〈世界文学システム〉への挑戦』(フランコ・モレッティ著、2013)という本がありますが、この中に収められた「世界文学への試論」では、コンピュータ解析や進化論を援用し、翻訳を許容することで「いかにすべての本を読まずに世界文学を語るか」が論じられています。「精読」に相当する伝統的な美術鑑賞だけなく、「遠読」に相当する別の鑑賞パラダイムについても、同時に考えていかなければなりません。もちろん両者の共存と使い分けがポイントになるわけですが。 大きくてわかりやすい歴史というのは、ある種の情報圧縮の手法です。そのわかりやすさが危険なのです。わかりやすさは、細部や小さいものを隠蔽します。しかし、細部に拘泥しすぎると、それは従来のような蛸壺化や専門分野の細断化を招きます。細部を見たり、分散的に考えながら、領域を横断したり、複合していくためにはどうすればいいのか。世界に対する新たな見方、鑑賞方法が必要とされています。 ディープラーニングや機械学習によって、個々の作品をひとつずつ精読するという、これまでの人間の深い鑑賞の仕方を見直すことができるかもしれません。たとえばアナドールがMoMAの膨大なデータベースから生成した画像や映像も、マノヴィッチのように見知らぬものというよりも、多数の個体の連続的インデックスとみなしたほうが良いと思います。そうすることで、連続的に変化する視覚的フォームから、学習データに潜在していた暗黙の類似性を発見したり、人間の物語では無視されてきた、思わぬつながりを発見できるかもしれません。 アナドールが行ったことは、生成というよりもむしろ鑑賞行為とみなすべきだと思います。デュシャンは「作品と鑑賞者の対話」こそが芸術行為であるといいましたが、膨大なデータベースを機械学習によって圧縮した潜在空間の中をナビゲートしていくということは、潜在空間の中で作品と対話することだといえます。 《Unsupervised》が示しているのは、MoMAのアーカイヴという世界に対する「遠読」の手法のひとつであり、そこで世界文学ならぬ世界芸術が見えてくるのかどうかを問うべきなのかもしれません。 僕自身は、汎用のAI技術を用いて作品制作を行ったり、エンターテインメント的なスペクタクルをつくりだすよりも、分析や批評のためのプラットフォームとして活用することに興味があります。音楽のキュレーターとしてのDJのように、キュレーターとAIが協働するとどのような展覧会が生まれるのか。もちろんそこには、前述の網膜主義的な限界が立ちはだかってはいるわけですが、それを乗り越えるのが、身体を持つ人間と、巨大な計算能力を持つ機械のハイブリッドなのだと思います。 ──そのためには鑑賞者側がもっとデータベースの手綱を握ることが大事ですね。 久保田:そうです。ディープラーニングや機械学習の方法というよりも、それが用いたトレーニングデータにより着目していく必要があると思います。今日の画像生成AIや、チャットシステムがどのようなデータを学習しているのかを、つねに頭に入れておかなくてはいけません。 たとえば、画像生成AIのStable DiffusionやDALL・E 2で使われているのは、LAIONというクリエイティブ・コモンズで提供されている研究用の画像データベースです。LAIONはネット上から無作為に収集された画像リンクとそのメタデータからなるデータベースで、なかでも最大のLAION 5Bには、約58億5000万枚の画像が登録されています。そのメタデータには、OpenAIのCLIPというツールを用いてつけられたキャプションが含まれていて、このタグによって画像とテキストを結びつけています。 さらにLAION 5Bのメタデータには、同じくCLIPモデルによって評価された10段階の美的パラメータ(Aesthetic Weight)が含まれていて、その値が7以上のものだけを選んだ、LAION-Aestheticsというサブセットがあります。しかしながらこれが曲者で、「犬」という条件で Aesthetic Weight が9(最高値)の画像と0(最低値)の画像を比較しても、「なるほど」ではなく「うーむ」という感覚しか生まれません。Stable DiffusionはこのLAION-Aestheticsを用いて学習しているので、結果としてその出力は何だか似通った、美的に均質なものになりがちです。 インターネット上の画像だけからなるデータベースには、西洋的価値や科学的価値のようなバイアスがかかっていて、世界の様々な文化やマイノリティーを平たく含むものではありません。当たり前のことですが、そもそもネット上にない画像は含まれていないわけですから、どんなに画像の枚数が多かったとしても、その文化的、歴史的な多様性は、極めて限られています。こうした技術やデータが持つ偏りや画一性、あるいはそれを生み出した経済構造や権力構造が、今日のAI技術を生み出しています。現在のAIは、人間同様に、多くの偏見に満ちていることから出発しないといけません。Google Mapsの道案内ではないですが、人はなぜか人間よりも機械のいうことを信じてしまいます。それがAIが持っている、いちばんの危険なのかもしれません。 *1──Lev Manovich「The AI Brain in the Cultural Archive」Jul 21, 2023 *2──人工知能などの最先端技術を駆使して17正規の画家レンブラントの“新作”を創るという試み。オランダのマウリッツハイス美術館とレンブラントハイス美術館のチームが、デルフト工科大学、マイクロソフトと協力して制作。346点に及ぶレンブラントの全作品が3Dスキャンを使ってデジタル化され、美術専門家の協力を得ながら、ディープラーニングアルゴリズムによって作品の特徴が分析。でき上がったイメージは、油絵具を用いて3Dプリントされた。オランダを本拠とする総合金融機関INGグループが出資している。 *3──ソーカル事件とは、1995年、ニューヨーク大学物理学教授のアラン・ソーカルが現代思想系の学術誌に論文を掲載したことに端を発する事件。論文はポストモダン思想家の文体をまねて科学用語や数式をちりばめた無内容なものであったが、それがそのまま受理・掲載されてしまった。ソーカルは論文のでたらめさを見抜けなかった専門家らを指弾するとともに、一部のポストモダン思想家が厳密な科学的意味に基づかないたんなる比喩や権威づけとして数学・科学用語を使用しており、こうした思想家らの著作がでたらめであると主張した。
久保田晃弘