渡辺明名人、1秒間に8000万手読むコンピュータを購入しディープラーニング系のソフトも導入(1)
【渡辺明名人】37歳。名人・棋王・王将の三冠を保持し、現将棋界の序列1位。近年はコンピュータ将棋(AI)を用いての綿密な研究でも知られる。ほとんどの棋士を相手に勝ち越し「現役最強」とも言われるが、棋聖戦五番勝負では藤井聡太棋聖に挑戦して敗れた。
(7月某日、LINEにて、渡辺名人が研究用の新しいマシンの購入を検討しているという話になり)
渡辺 将棋ソフト用のパソコンと最新のソフト事情について教えてもらいたいんですけど。
松本 それなら水匠開発者の杉村達也さんが適任です。ご紹介しますよ。
渡辺 ディープラーニング系のソフトってなに?ってところですよ、私は(笑)
松本 ますますちょうどいい。私もそのあたり、さっぱりわからないので(笑)。ところで新しいマシンを買うのだと、たとえば藤井聡太さんみたいなモデルはCPUだけで50万円らしいですね。
松本 ということは、トータルで予算80万円ぐらいですかね。
渡辺 たけーな(笑)
(しばらくして)
松本 杉村さんに聞いてきました。これとかどうですか、とのことでした。
(提案されたのはCPU、GPUともにほぼ最強、税込130万円ぐらいのマシン)
渡辺 え、高い(笑)
松本 ですよねー(笑)。詳しいことは杉村さんに来てもらってうかがいましょう。
【杉村達也弁護士】34歳。本八幡朝陽法律事務所。趣味でコンピュータ将棋「水匠」(すいしょう)を開発し、2020年のコンピュータ将棋選手権オンライン大会で優勝。
杉村 コンピュータ将棋水匠開発者の杉村と申します。よろしくお願いいたします。
渡辺 この度は急なお願いにご協力いただき、ありがとうございます! さきほど送っていただいたものはネットから普通に買えますか?
杉村 在庫ありとなっているので、普通に買えると思います。
渡辺 とりあえず買います。
杉村 すごい。
渡辺 え、でもこれ以下は妥協って感じなんですよね?(笑)
杉村 確かに、妥協ですね(笑)
渡辺 どうせ買い換えるなら、これ、ということですか。
杉村 コストパフォーマンスを考え出すと難しい選択となりますが、最高峰の性能、という中での最安であればこれだと思います。
松本 消費税分だけでそこそこのパソコン買えそう。
渡辺 ドキドキします(笑)
(しばらくして後日、渡辺名人宅に新しいマシンが届く)
DL系ソフトの台頭
(7月某日、杉村弁護士と松本で渡辺名人宅訪問)
松本 お邪魔します。おおお、でかい。
渡辺 妻からはドン引きされました(苦笑)
杉村 『将棋の渡辺くん』に描かれるのを楽しみにしています(笑)
松本 このマシン、渡辺名人の研究部屋の3畳間に置かれてみると、ますます存在感ありますね・・・。ではセッティングしながら、いろいろお話をうかがえればと思います。
渡辺 そもそもディープラーニング(DL)ソフトとはどんなもので、どれぐらい強いんでしょうか?
杉村 2017年、Google・DeepMindによって発表されたAlphaZeroとほぼ同じような仕組みです。評価関数に深層学習モデルを使用し、探索手法にモンテカルロ木探索を採用しているのが特徴です。
松本 DL系の台頭に至るまでの近年のコンピュータ将棋の歴史を簡単に振り返ると。2017年、電王戦でponanzaが佐藤天彦名人(当時)に勝って、コンピュータと人間の戦いに事実上の終止符が打たれました。
松本 同じ年のコンピュータ将棋選手権ではそのponanzaに対してelmoが勝って優勝します。
松本 また同じ年、そのelmoにAlphaZeroが90勝8敗2分という結果を残したという発表がされました。
松本 設定が甘い漫画のように、次々と現れてくる強キャラのインフレ化が激しい状況です。AlphaZeroは公開されてないので対戦はできない。2017年当時のelmoに対して、杉村さんが現在開発されている水匠の対戦成績は・・・。
杉村 96勝4分(千日手)ですね。
松本 ちょっとなに言ってるかわからない、という感じですね(笑)。当時のelmoに対して水匠は、二枚落ちで勝つこともあるんでしたっけ?
杉村 そうですね。
松本 一方で、そのAlphaZeroの系譜を組み、DL系の代表格であるdlshogiもまた、最近めちゃくちゃ強くなってきた・・・というのが最近のコンピュータ将棋界の最前線ですね。2020年、電竜戦を制したのがdlshogiでした。
杉村 いまは従来型の将棋ソフト(NNUE系)と新しいDL系の将棋ソフトが完全に互角ぐらいの強さなんです。いちばん楽しい時期かもしれません。
渡辺 従来型のソフトは、ゆくゆくは勝てなくなっちゃうんですか?
杉村 たぶん1年後には、いままでの将棋ソフトは全部駆逐されちゃいますね。
渡辺 ええっ! そうなの?(笑)
杉村 その未来が見えてるので、私も含め、今は新しい方しかほとんど開発してない開発者が多いです。いまは移行期ですね。
渡辺 決定的になにが違うんですか? もう作り方が違う?
杉村 そうですね。作りが違います。決定的に探索が違うし、使うパーツも違うし。ほとんどすべてが違うので。ついに、Bonanza以来の仕組がほぼすべて変わった感じです。
松本 Bonanzaは2005年発表でコンピュータ将棋界にブレイクスルーを起こしました。2007年に歴史的な渡辺明竜王-Bonanza戦がおこなわれて。
渡辺 新しいDL系のソフトも、誰でも真似できる作りなんですか?
杉村 そうですね。これまでと同じく、オープンソースで公開されているので。
渡辺 莫大な費用がないと無理とか、そういうんじゃないですね。
杉村 はい。ただ、自己対局をさせてその結果を学習させるという部分でマシンパワーをむちゃくちゃ使うので。dlshogi開発者の山岡忠夫さんはHEROZに所属されています。
松本 HEROZは対戦アプリ将棋ウォーズで有名なIT企業ですね。山本一成(ponanza)、平岡拓也(Apery)、一丸貴則(ツツカナ)という有名将棋ソフトの開発者の皆さんも所属している。
(松本追記:PALの山口祐さんもでした)
杉村 HEROZは会社のマシンが使われてないときには、社員の皆さんは使っていいそうなんです。その使っていいマシンが一般人の1000倍ぐらいの性能で(笑)。それに対抗できるのかっていう話になっています。
松本 大資本は強い(笑)。ただ日本のコンピュータ将棋開発は、基本的には企業や大学といった大きな組織よりも、個人の努力によって大きく発展してきた経緯があります。それでもまたいまはマシンパワーが必要な時代なんですね。コンピュータ将棋選手権を見ていると、時代によって変遷を感じます。いままではCPUのパワーが必要だった。
松本 しかしごく最近のトレンドであるDL系ではGPUが必要になると。
杉村 そうですね。CPUも使ってはいるんですけど、主にGPUですね。ハードウェアのスペックでも、CPUはけっこう頭打ち感あるんですけど、GPUはどんどん上がっているので。
松本 この新しいマシンもGPUが手厚い感じなんですね。
杉村 そうです。
松本 DL系にスキというか、弱点はないんですか?
杉村 DL系は仕組上、頓死が防ぎにくいと思うんです。
松本 それ不思議ですよね。
杉村 探索速度が1000分の1とかなので。やっぱり即詰みなど、読み進めた結果が重要な局面には弱いですね。なので、わざわざ詰将棋エンジンを別に動かしているっていう仕組を取っていて。それでも5手先の必至とか相当ダメなんです。それで逆転負けするという。それが防ぎづらいですね。そこがチェスとか囲碁とかと違うところかもしれません。将棋って終盤になっても全然合法手減らないじゃないですか。持ち駒が使えるので。チェスはどんどん駒が減っていくし、囲碁もどんどん打てる場所が減っていく。おそらく終盤が簡単になってると思うんですけど、将棋は合法手が減らないので。
松本 DL系のソフトを使っている棋士というのは?
杉村 藤井聡太先生が使われるというインタビュー記事を見ました。あと、私がちょくちょくお会いしている棋士は使っています。
松本 DL系が水匠と違う候補手を選ぶっていうのは、よくあるんですね。
杉村 そうですね。それがとても面白いので、ぜひ。
渡辺 へええ。そんな違う手を選ぶんですか。
杉村 今度ですね、dlshogiと水匠の長時間マッチをやろうと。
松本 長時間で頂上決戦! コンピュータ将棋界の名人戦!
杉村 持ち時間90分で、1手指すごとに15秒追加っていう。
松本 長時間でのフィッシャーモードですね。
杉村 解説に阿部健治郎七段と佐々木勇気七段に来ていただいて、けっこう真面目にイベントを開こうと思ってて。
渡辺 それ、エキシビションマッチなんですか?
杉村 そうです。いままでのNNUE型とDL型がいま本当にいい勝負だと思うので、ちょうどいいところでやっとこうかな、と。
松本 新興勢力とね。
杉村 いい勝負だと思います。
(dlshogiと水匠の対局は後日8月15日におこなわれ、渡辺明名人も特別ゲストとして登場。dlshogiが2勝1敗という成績を残した)
(この記事、全部で2万4千字あって、その2以降、まだまだ続きます)