グーグルAI幹部が明かす「AIと共存」に2つの道筋 「Google DeepMind」で実現してきたこととは?
それは、①明確なルール、②明確なスコア、③管理された環境、です。 そのため、純粋にAIの能力を高めていくことが可能となります。 そうした環境の中で、アルゴリズムには、間違えたらペナルティ、正しければ報酬を与えるという、『強化学習』と呼ばれるテクニックを活用でき、現実世界の数多くの問題を解く際の研究方法と青写真になっています」(アジャラプ氏) ゲームという環境は、現実社会とは異なり、プレイヤーの振る舞いがゲームに勝つことに限定されるようになる。そのため、AIの能力を確認するうえで最良の環境だったという。
ここで、プログラムの名前通り「AlphaGo」は、「碁だから能力を発揮できたのではないか?」という次の疑問が浮かぶ。しかしここにこそ、AlphaGoが当時注目された理由が隠されていた。 「驚くべきことに、AlphaGoには、碁のルールをプログラムしていないのです。つまり、ルールを知らずに学習を始めて、プロを打ち負かしているのです。 そのため、異なる遊び方や地域によって異なるルールでの対局になったとしても、AlphaGoは等しく成果を発揮することができます。
さらに、碁以外のゲームを学習させることで、同じアルゴリズムであっても、異なるゲームで勝つこともできるようになるのです」(アジャラプ氏) そこでユニークな実験として、AlphaGoのプログラムで、効率的なビデオ圧縮に取り組ませたり、核融合の制御への最良のアプローチを行うなど、碁ではない作業をさせてみると、これらがうまく問題を解決していくという。現実世界の中でも、最適な状態や正解が存在する問題に、取り組むことができたという。
「AIがすべての問題を解決するとは考えていませんが、科学にとっては特別な働きをしてくれると思います。そのため、常に仮説に基づいて、検証していきました。 インパクトがあり、根源的な問題であり、改良や最適化ができたかが明確にわかることに取り組むのが、我々のアプローチです」(アジャラプ氏) ■AGIとエージェント AGIは、「汎用人工知能」と訳され、現在AI企業がこぞって実現に向けて取り組むべきテーマとなっている。AGIは、あらゆる情報の認識ができ、推論を行い、知識を持ち、計画を立て、自己学習が可能、かつ自然言語処理によるコミュニケーションが取れる存在だ。