渡辺明名人、1秒間に8000万手読むコンピュータを購入しディープラーニング系のソフトも導入(3)
最善の研究手法を求めて
松本 思い出すのは2005年当時のBonanzaが出てきた頃のことですね。Bonanzaはそれまでの将棋ソフトとは全然違う手法で開発されて、突然彗星のように現れ、ブレイクスルーになりました。
松本 ただしBonanza以前の、精巧に職人技で調整されたようなコンピュータ将棋ソフトだって決して弱くはなかった。むしろその強さはプロ棋士に迫ろうかという勢いでした。それらのソフトはしばらく競り合う期間があって面白かったです。Bonanza以来の流れを組む現在の型と、新興のディープラーニング(DL)系が拮抗している現在の状況もまたしかりですね。
渡辺 これ(DL系のdlshogi)道中は、従来のソフトと全然違うことを言うんですか?
杉村 同じようなことを言うことも多いです。(従来のソフトも)元から強かったので。
渡辺 そうなんですね。中盤ぐらいでどれぐらい違うことを言うのかな。
杉村 dlshogiは序盤が強いものの、終盤に頓死することがあって。
松本 スキがあるとしたら、終盤の詰む詰まないのところなんですか?
杉村 他にも中盤もこれを見落としたら明らかに不利になるみたいなのがあるじゃないですか? そういうのをミスして劣勢に陥るみたいなのがありますね。
渡辺 じゃあ研究に使うには適さないですか?
杉村 序盤の研究はdlshogiの方が正しいことが多いと思うんですけど。ちゃんと(従来型と)並行して動かした方がいいと思います。その並行する設定をいまからします。それでどっちも見ていただくのが正しい研究の仕方なんじゃないかな、と思います。
松本 セカンドオピニオン。
杉村 そうですね。dlshogiはこの評価値、水匠はこの評価値と、並行で動かせるので。
渡辺 ということは、それぞれ少しずつ落として動かすってことになるんですか?
杉村 あまり性能は変わらないと思います。つまり従来型はCPU、新型はGPUで動かしてるので。このマシンはパーツどっちも(手厚く)あるので。全然変わらないかと言われると、わからないですが。
渡辺 こっち(前のパソコン)ではそういうのは全然できないんですね。
杉村 そうですね。GPUが入ってないので、できないに等しいと思います。
渡辺 そもそもこっち(前のパソコン)だとdlshogiは動かないんですか?
杉村 動きますけど、1秒に100手とかしか読めないですね。
渡辺 そうなんだ。それはキツいね。
杉村 100手でも強いですが、研究には適さないです。
渡辺 じゃあみんなこれからもう、高いマシン買うんだな・・・。
杉村 そうですね。ただ、CPUよりはGPUは全然安いので。
松本 GPUの価格がいま高騰してると聞きましたが。
杉村 それはマイニングのせいですね。
松本 ビットコイン! そうかそうか。やねうらおさん(やねうら王開発者)がそれでマイニングするみたいなことを言ってませんでしたっけ?
杉村 多分全然やってないですよ(笑)
松本 冗談なんだ(笑)
杉村 そうなんですけど、やねさん、今(7月現在)は少なくともコンピュータ将棋の開発はまったくやってないです。
渡辺 たしかにあまり見かけないですね。
松本 もう情熱を失くしたとか?
杉村 いや。「暑いんでやる気ないわ」みたいな。秋にはやる気がでると思います(笑)
松本 そうなんだ(笑)。改めて言うまでもないですが、やねさんはここまでコンピュータ将棋を強くした大功労者の一人ですね。
杉村(棋譜を検索して)ええとですね、これコンピュータ将棋の高スペックマシン同士で戦ってる対局なんですけど。(グラフの線の)赤いのがdlshogiの評価値で、緑がいままでの水匠の評価値で。だいたい(水匠が)互角だと思ってるところで(dlshogiは)有利を出して、そこから勝ち切る。序盤に有利を発見してしまう力が高いんです。
渡辺 そんなことがあるんですか。水匠の上に行くってことが。
杉村 あるんですね。水匠は読めてないんです。全然互角だと思ってるんだけど、dlshogiからしたらすでに差がついている。これがdlshogiの勝ちパターンです。dlshogiの負けパターンは(別の棋譜を示して)こんな風に負けて。終盤のいい手に気づかないで頓死とか、必敗形にしてしまうとか。やっぱり読みの量が少ないので。詰む、詰まないに弱いんですね。
渡辺 研究ってだいたい、詰む、詰まないの変化を内包しますからね。
杉村 なので、両方を動かしていただくのが正しい研究の仕方だと思います。
渡辺 なるほど・・・。そうすると、ただ良いパソコンを買っても、ちゃんとセッティングして使いこなせないと、もったいないですね。良いパソコンでただ「水匠動かしゃいいんだろ」ってやっても、ここ(パラメータ)の設定とかできないと。
杉村 そうです。これ(デフォルトのパラメータ)はどんなパソコンでも動く設定にしてあるんで。
松本 杉村さん、将棋連盟の公式アドバイザーになった方がいいのでは。
渡辺 確かに。
杉村 いやいや(笑)
渡辺 人脈がない人が不利になってきそう。誰にお願いしていいの、って感じで。もともとベテランの先生からは「不公平だ」みたいなことを聞いたりします(笑)。「できねえぞ」みたいな(笑)
杉村 はい、動きました。これがShogiGUIで複数候補手が出せるんです。上が水匠の評価値、下がdlshogiの評価値。
松本 これで同時に見られるわけですね。
渡辺 なんでもいいんで、20手ぐらい動かしてもらえますか? 局面を複雑にしてもらえます? 駒をぶつけて。
杉村 はい。(中飛車にする)
渡辺 ちょっと(居飛車側を)二枚銀みたいな形にしてもらって。・・・これ楽しそうだねえ・・・(笑)。これ、研究するの楽しそう(笑)
松本 本当に楽しそうだ(笑)。見てるこちらまで幸福な気分になりますね(笑)
杉村 こうすると評価値で(水匠とdlshogi、同一局面を評価しているのに)だいぶ差がつきましたね。
渡辺 全然違っちゃいましたね! なんでだろう? なんでこんなに一気にちぎれたんだろう?
杉村 dlshogiの方が表示されている読み筋は信頼できる気がします。水匠とかいままでのやつは、読み筋は結構適当なんで。
松本 えっ、適当なんですか?(笑)
杉村 読み筋はすぐ変わるので信用ならないです。評価値と最善手はある程度信用できますけど、読み筋は信用できません。dlshogiの方が信用が高いと思います。
渡辺 細かく突き詰めていくとだいぶ違ってくるんだろうな・・・。(マシンの排気で部屋が熱くなってきて)これだけで冬はあったまりそう(笑)。夏は逆にひどいけど(笑)
(ここまでで半分ぐらいです。その4に続く)