「アルファ碁」が世界トップ級棋士に勝ち越し 人間の「大局観」超える人工知能

「ディープマインド」共同創業者デミス・ハサビス氏(左)とイ・セドル9段(写真:Lee Jae-Won/アフロ)

5番勝負で3連勝

ロンドンにある人工知能開発会社「グーグル・ディープマインド」が開発したプログラム「アルファ碁」が12日、韓国のプロ棋士で世界トップレベルのイ・セドル9段との5番勝負で3連勝し、勝ち越しました。イ9段は残る2局で一矢報いたいとしています。この日は間違いなく歴史に刻まれるでしょう。

画像

「ディープマインド」の共同創業者デミス・ハサビス氏は「歴史的な瞬間だ」とツィートしています。なぜ「歴史的な瞬間」なのか、人工知能の歴史を振り返りましょう。

1950年 ナチスドイツの暗号機エニグマの解読にも成功した英国の天才数学者アラン・チューリング氏が「チューリング・テスト」を提案。人間が音声を同じにした人間と機械とそれぞれ対話して区別できなければ「人工知能」と認められるという基準を示した

1952年 コンピューターがマルバツゲームを習得する

1994年 コンピューターがボード(盤上)ゲームのチェッカーに勝つ

1997年 チェス専用に開発された米IBMのコンピューター「ディープ・ブルー」がチェス世界王者ガルリ・カスパロフ氏を下す

2011年 IBMの高性能コンピューター「ワトソン」が米人気クイズ番組「ジョパディ!」で2人のチャンピオン相手に圧勝する

2014年1月 ディープマインドが推定4億ドル(約455億円)以上でグーグルに買収される

2014年 ディープマインドのアルゴリズム「ディープ・Qネットワーク」がビデオ・ピンポンやスペース・インベーダーズなどビデオゲームのやり方を学習し、29種類のゲームで人間以上の腕前になる

2015年10月 ディープマインドの「アルファ碁」が欧州チャンピオンのファン・フイ2段に5番勝負で全勝する

10の171乗通り

19路盤の囲碁では、局面数は10の171乗もあります。天文学的な数字です。オセロゲームは10の28乗、チェスは10の50乗、将棋は10の71乗。しかも囲碁にはチェスや将棋の駒得のような明確な評価基準がなく、プロ棋士に勝つ囲碁のプログラムを作るのは難しいと言われてきました。

ケンブリッジ大学コンピューター研究所のマテヤ・ジャムニック上級講師は「人工知能の開発は、ビッグデータ、ディープラーニング・アルゴリズム、スーパーコンピューティングのおかげで飛躍的に進歩しています」と指摘します。

ディープラーニングとは多層構造のニューラルネットワーク(人間の神経回路を模して作ったネットワーク)によるマシンラーニング(機械学習)のことを言います。ジャムニック上級講師が言う「スーパーコンピューティング」には「クラウドコンピューティング」を加える必要があるでしょう。

木のように枝分かれした単純な検索ツリーを使ったプログラムでは囲碁のプロ棋士に勝てる可能性は皆無でした。そこで「アルファ碁」には、さらに進んだツリー検索と多層構造のニューラルネットワークを取り入れたそうです。12の異なる多層構造が数百万のニューロン(神経細胞)のようなつながりを構築しています。

1つのネットワークが次の一手(ポリシーネットワーク、小局)を考え、別のネットワークが勝者(バリューネットワーク、大局)を予測します。開発チームは専門棋士が打った3千万手を使って「アルファ碁」のニューラルネットワークを鍛えに鍛えました。そしてついに人間が打つ手の57%まで予測できるようになりました。

しかしそれでも世界トップレベルのプロ棋士を打ち負かすことはできません。そこでグーグルのクラウドコンピューティングを使って、ニューラルネットワーク同士で数千の対戦を繰り返し、勝つと得点などの報酬が与えられる強化学習によってネットワークのつながりを修正していきます。

「人類の敗北ではない」

「アルファ碁」は人間の頭脳のように発達していきました。その結果、他の囲碁のプログラムと対戦して499勝1敗の戦績を収めます。そしてついに欧州チャンピオンのフイ棋士を5戦全勝で打ち負かします。毎日新聞によると、この日、3連敗を喫したイ9段は、「これほど厳しい圧迫感を経験したことがなく、私の能力不足だ。これはイ・セドルの敗北であって、人類の敗北ではない」と強調したそうです。

中央日報は「<囲碁:人間VS人工知能>神秘の領域、中央の『厚み』アルファ碁は計算した」と驚きを伝えています。

「アルファ碁が5千年間続いてきた囲碁の原理を根本から書き換えつつある。核心は中央攻略だ。かつて人間が『厚み』と命名して神秘の領域として残してきた空間を、アルファ碁はついに精密な計算力で征服し遂げている」

出典:中央日報

碁盤の隅や辺が整理された後に石が置かれる中央はプロ棋士でも感覚に頼ることが多いのに、「アルファ碁」は最初から計算したように序盤から中央を大胆に占めていったと伝えています。プロ棋士を超える構想力です。

囲碁は可能な手が天文学的なためコンピューターでも計算しきれません。人間の場合は「着眼大局、着手小局」とよく言います。大局は計算できませんが、小局は計算できます。「アルファ碁」はポリシーネットワークとバリューネットワークを使ったこれまでの学習から一番勝ちそうな手を選んで打っているので、「着手大局」をも可能にしたと言えるのではないでしょうか。

0か1かで動いているコンピューターが学習によってニューロンネットワークのつながりを修正し、勝つ確率を高めて、ついに世界トップレベルのプロ棋士を打ち負かしたのです。イ9段は「着手大局」を実践する「アルファ碁」の前に敗れたのです。

人工知能のゴールドラッシュ

今、米シリコンバレーだけでなく、ロンドンの「シリコン・ラウンドアバウト」と呼ばれるテクノロジー企業やスタートアップの集積地でも、人工知能のゴールドラッシュが起きています。

ディープマインドのハサビス氏は今年1月末のブログで「ゲームは人工知能のアルゴリズムを速く、効果的に開発し、テストする完璧なプラットフォームです。私たちは究極的にこうした技術を気候変動や複雑な疾病の分析など重要な現実世界の問題に適応したいのです。この技術を何に使えるのか非常に興奮しています」と述べています。

人工知能は近い将来、人類にとんでもない悪夢をもたらす恐れが指摘されています。人工知能はまさに日進月歩の進歩を遂げていますが、人間と違って今のところ自分でゴールを設定することはできません。ハサビス氏がグーグル傘下に入る条件の一つが、人工知能倫理委員会を設けることだったそうです。

(おわり)