Yahoo!ニュース

動画生成AIやアニメ背景生成AIも登場。過熱する生成系AI開発競争の中で考えるべきこと。

徳力基彦noteプロデューサー/ブロガー
(出典:Runway 公式YouTube)

今年に入って、毎日の様にChatGPTやマイクロソフト、そしてGoogleの新しいチャットAIについてのニュースが報道されています。

昨年後半は、画像生成AIの話題が中心だったことを考えると、AIに関する話題の変化の早さに驚く方も少なくないでしょう。

そんな中、今度は画像生成AIの話題の火付け役だった「Stable Diffusion」の共同開発企業であるRunwayが、「Gen-1」という動画生成AIを発表し、話題を集めています。

参考:MIT Tech Review: 生成AIが新章突入、Stable Diffusion共同開発元が動画版を発表

その能力の高さは動画を見て頂ければ一目瞭然。

既存の動画にスタイルを指定したり、写真を適用することで、動画をクレイアニメやイラストやCGのように加工することができるようになるようで、業界でも大きな注目を集めているようです。

さらに、Netflixは、rinna、WIT STUDIOと共同で、独自の画像生成AIを活用してアニメ背景画の自動生成ツールの開発を行っていたことを発表。

「犬と少年」という3分ほどの短編アニメを公開しました。

参考:Netflixが「画像生成AIでアニメ制作」してわかったAIの限界…『犬と少年』で挑戦したもの

日々、こうした新しいAIのニュースが次々に出てきますし、チャットAIについてはマイクロソフトとグーグルのAIを通じた検索の覇権争いという報道も激化しています。

そのため、一般の方からすると、勝ち組が決まってから使えば良いかと、他人事のように感じている方もいるかもしれません。

しかし、現在のAIに関するトレンドを、自分には関係ないと誤解するのは大きく間違っています。

AIの開発競争自体は昔から続いている戦い

本来、IT大手のAI開発競争自体は今に始まったことではありません。

AIの概念自体は、1950年にイギリスの数学者アラン・チューリングが出版した「計算する機械と人間」という書籍に起源があると言われています。

その後、何度かAIはブームになり、落ち着いてというサイクルを繰り返し、2006年以降にディープラーニングやビッグデータの普及を軸に第3次AIブームに入ったと言われている段階です。

当然ながら、Googleやマイクロソフトなどの大手IT企業には以前から多数のAI開発者がいますし、既にさまざまなプロダクトにAIが導入されています。

例えば、2015年にマイクロソフトが「女子高生AIりんな」を開発し話題になったことを覚えている方も少なくないでしょう。

現在では、TikTokのおすすめや、FacebookのフィードにもAIが導入されていますから、多くのユーザーは既にAIを使った製品を日々使っているわけです。

ただ、これまではそうしたAIを、私たちがAIと意識して自ら利用することはあまりなかったわけです。

画像生成AIの無料配布がパンドラの箱を開ける

そんな状況が大きく変わることになったのは、生成系AI(Generative AI)と呼ばれる新しいアウトプットを生み出すAI群の登場です。

まず2022年の8月頃から、日本でも「Midjourney」という画像生成AIが業界関係者を中心に注目を集めていたのをご存じの方も多いでしょう。

そして、この現在の流れに決定的な一石を投じたのが、昨年8月23日に「Stable Diffusion」という個人が保有しているPCでも動作可能なAIモデルが、オープンソースで無償公開されたことです。

参考:人工知能の無料配布は、パンドラの箱か、新しい世界変革のはじまりか

当時の記事でも引用しましたが、ポイントとなるのは、従来こうしたAIを一般に公開する行為は「社会への影響が大きすぎる」という考えを持つ企業や研究者が多かったという点です。

しかし、昨年8月の「Stable Diffusion」の無料配布の衝撃は、完全にAI開発の注目点をオープンとクローズドの対決に切り替えてしまいました。

文字通りパンドラの箱がひらく結果になったわけです。

パンドラの箱がひらきオープン化が連鎖

そのパンドラの箱が開いた影響は、次々に連鎖します。

まず「Stable Diffusion」が無料配布された際に、クローズドで一般の人が使えない象徴としてGoogleと共に名指しされることの多かった画像生成AI「DALL-E」を開発していたOpenAIが、すぐに方針を転換。

自らの画像生成AIの「DALL-E」の無料配布を開始し、2022年11月にはAPIも公開します。

参考:画像生成AI「DALL・E 2」がAPIを公開、アプリやサービスに組み込めるように

そしてOpenAIは、矢継ぎ早に今度は11月の月末に、チャット生成AIであるChatGPTをライバルに先んじて一般公開。

たった5日で100万ユーザーを集めたと思えば、2か月で1億ユーザー到達という驚異のスピードで世界中を席巻することになるわけです。

興味深いのは、今度はOpenAIのCEOであるサム・アルトマンが1月中旬のフォーブスのインタビューでこう発言していることです。

最も重要なのは、ChatGPTのようなオープンなツールを提供することだと思います。グーグルは、こういったものを一般向けには公開しません。

他のラボも、安全性を懸念する人たちがいるため公開しないのです。

しかし、私は、社会がこれを感じ取り、格闘し、プラスやマイナス面を理解することが必要だと考えています。

参考:ChatGPTの生みの親、サム・アルトマンが語る「AIと検索と資本主義の未来」

見事にOpenAIは、「Stable Diffusion」公開時に自社が指摘されていたことを、Googleに対して指摘する側に変わっているわけです。

その後の展開は皆さんご存じの通りです。

それまで自社のAIを一般公開するのに後ろ向きだったGoogleも、その姿勢を一転、自社のLaMDAという言語モデルを実装したチャットAI「Bard」を鳴り物入りで発表することになります。

その後「Bard」が、デモ動画で不正確な回答を表示していることが話題になってしまったことが、いかにGoogleが焦って自社のサービスを発表する羽目になってしまったかを象徴しているように感じます。

参考:グーグルのAIチャットボット「Bard」、デビュー早々に失態--不正確な回答を表示

つい1年前までは、AIの開発競争は、研究者や大手企業による密室の中での出来事だったのが、「Stable Diffusion」の無料配布により、いかに世界中の人に使ってもらえるかという競争に変わってしまったわけです。

AIが影響を与えるのは人間の仕事のあり方

もはや、開いてしまったパンドラの箱は閉じることはありません。

多くの研究者が懸念していたように、生成系AIが一般化されたことによる問題もこれから明らかになってくるでしょう。

実際に、チャットAIに対する期待値は明らかに現在は高すぎるという指摘が多くの専門家からされています。

参考:なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方

実際問題として、チャットAIの基本的な仕組みは、文章の続きを確率的に計算して生成するという仕組みのため、検索のような正解を探す行為には根本的に向いておらず、当面は間違えるのが当然と考えるべきものだそうです。

ただ、この半年ほどでAIをめぐる状況が全く変わってしまったように、これからAIをめぐる状況は更に変化が加速する可能性が高いと考えられます。

AIの進化を他人事と考えていること自体が、実は大きなリスクになる可能性が見えてきているのです。

まずは、自らの仕事にAIがどのような影響を与えるのか、自分の仕事にどのようにAIを活用できるのか、考えるべきタイミングにあるように思います。

noteプロデューサー/ブロガー

新卒で入社したNTTを若気の至りで飛び出して、仕事が上手くいかずに路頭に迷いかけたところ、ブログを書きはじめたおかげで人生が救われる。現在は書籍「普通の人のためのSNSの教科書」を出版するなど、noteプロデューサーとして、ビジネスパーソンや企業におけるnoteやSNSの活用についてのサポートを行っている。

徳力基彦の最近の記事