AIが「新しいインチキ」にならないために。AI研究者が見た2024年の生成AIとOpenAI総括
2024年がもうすぐ終わろうとしている。 OpenAIが鳴物入りで始めた平日12日間連続の発表会は、AGIテストで飛躍的な成果を出したという「o3」の発表で幕を閉じた。 【全画像をみる】AIが「新しいインチキ」にならないために。AI研究者が見た2024年の生成AIとOpenAI総括 2024年末、12日間の連続発表が終わった直後というこの象徴的な時期に、批判的な視点も含めて、プログラマーでAI研究者でもある筆者の視点で、OpenAIと生成AIの最新動向を総括してみたい。
OpenAIの「失敗」と中国勢の脅威
「o3」の発表は、多いに話題になったが、率直なところ個人的には冷ややかに見ていた。我々AI業界ではこういった、ベンチマーク結果の自慢だけをする発表を「自慢リリース」と呼んでいる。 OpenAIの発表だから嘘ということはないだろうが、触ることができない以上、社外の人間がそれが本当かどうか確かめることはできないからだ。 AI業界、特に生成AIに関わる業界には、誇大広告や実態のない詐欺まがいの論文が跳梁跋扈(ちょうりょうばっこ)している。もちろんその中には数少ない本物もあるのだが、玉石混交の世界で本物を見極めるのは本当に難しい。しかも、石が圧倒的に多いのだ。筆者がしばしばAIを「新しいインチキ(Artful Illusory)」と呼ぶのはそういう状況があるからだ。 最初に断っておくが、筆者はAIを愛している。プログラマーとして10年以上にわたってディープラーニングを研究してきたし、複数の東証プライム上場企業との共同研究やAIに関する事業展開をしてきた。 だからインチキくさいAIの話を聞くと気分が悪くなる。そういう時には、「ああ、あれはAIはAIでも、新しいインチキの話をしてるんだな」とでも思わないと身が持たないのだ。 OpenAIはしばしば「自慢だけしてもったいぶる」癖によって幾度も失敗してきた会社だ。 今回ようやく正式にリリースされた動画生成AIの「Sora」も、本来発表されたのは10カ月も前の2024年2月だった。 ところが、OpenAIがいつまで経ってもSoraをリリースしないので「LTX Studio」や「Kling」「Pika2.0」「Runway Gen-3 Alpha」と言った動画生成サービスが次々とリリースされ、さらには「CogVideoX」や「LTXV」「HunyuanVideo」など、オープンソースでカスタマイズ可能な動画生成モデルまで出現してしまった。 Soraは完全に出鼻をくじかれ、いざスタートした正式サービスも、先行するサービスに比べて安くも高くもなく、性能もそれほどでもないというパッとしない登場になってしまった。 (とりあえず作ってみて2週間前にYouTube公開したSoraを使った動画はこちら) この出し渋るというミスをOpenAIは以前にもやっている。 「DALL-E」という画像生成モデルを自慢だけしてぐずぐず公開しないでいる間にグーグルから「Imagen」という拡散モデルが登場し、「Midjouney」というサービスに先行され、さらにはStability.aiによる「StableDiffusion」という破壊的なオープンソースモデルが登場し、一気に存在意義を失った。 それにしても、最近の中国のAIは、最前線を見ているAI研究者としても驚異的だ。 まずすごいのが、全部オープンソースにしてしまうところである。テンセントでもバイトダンスでも、とにかく「こんなすごいものが」というモデルをどんどんオープンソースにして配ってしまう。 つまり、誰でも無償で使える。彼らに一体何のメリットがあるのか、目的がわからなくてむしろ怖いくらいだ。 この12月は、OpenAIとグーグルが対照的なつばぜり合いをしていたのも興味深い。 OpenAIが毎日、日本時間午前3時(太平洋標準時10時)に地味な発表を重ねることで世界中の非カリフォルニア居住のAI研究者を寝不足に陥れている一方で、グーグルは長距離マラソンのランナーのようにコツコツとOpenAIの発表直前にGeminiのアップデートを発表した。 グーグルからしてみれば、OpenAIの発表のインパクトが相対的に薄まるという作戦を展開していた形だ。