渡辺明名人、1秒間に8000万手読むコンピュータを購入しディープラーニング系のソフトも導入(5)
ソフトはなぜすぐ千日手を主張するのか?
松本 将棋の中継を見ていると、ソフトはすぐに千日手を主張するような気がしますね。
渡辺 dlshogiはあまり千日手は言わないんですか?
杉村 言わないです。基本的には(評価値が)1ケタぐらいになったら千日手に近づくんですけど。
渡辺 水匠はわりとすぐに千日手って言うんじゃないですか? いままでのソフトは。
杉村 水匠はそうですね。でもdlshogiはほとんど千日手は言わないです。dlshogiの仕組みは「この局面から指し継がせるとどっちが勝つか」っていう仕組みに近い形で評価値を出すので。千日手で探索が終わるってパターンっていうのが少ないみたいですね。
松本 dlshogiは知らないんですけど、水匠はすぐに千日手が最善と言ってくるイメージがあります。
杉村 水匠が千日手ばっかりを示すのは千日手の評価値の設定を「1」にしてるからですね。人間同士の対局だと、先手は千日手を当然避けたいじゃないですか。
渡辺 はいはい。
杉村 コンピュータ将棋は千日手は完全に引き分け、0.5勝なので全然評価値「1」でいいっていう設定なんですが、そこは変えることができるんです。
渡辺 いや、千日手でもいいんですけど(笑)。dlshogiはそもそも、そういう概念じゃない?
杉村 そうですね。dlshogiは「1」って概念じゃないです。千日手のときは確か「0」って出しますけど。水匠であれば、たとえば先手だけは千日手を「-128」の評価値、後手は「-1」のままに設定すると、先手は千日手を避けるんだけど、後手は避けないという設定も可能です。
渡辺 なんで128なんですか?
杉村 それはponanzaがそうだから、というだけで深い意味はないです(笑)
松本 やねうらおさんが2019年のコンピュータ将棋選手権で最後、先手でも千日手歓迎の設定に変えて、千日手に持ち込んでポイントをキープして優勝したことがありましたね。
渡辺 やっぱり全部「1」の設定にしてもらえますか? もうそっちの方が慣れちゃってるんで(笑)。まあ別に、先手で千日手でもいいんです。知識としてわかっていれば。
杉村 わかりました(笑)
これからはGPUが必要
渡辺(パラメータ設定の画面を眺めながら)その一つ一つの英語が、もうなんなのかがわからない(笑)。こんなのわかってる棋士います?
松本 千田さん(翔太七段)とかわかってそうですね。さてこれで、すごいスペックのマシンにdlshogiも導入。研究がはかどりそうじゃないですか。
渡辺 使いこなせればね(笑)。そう、使いこなせるかが・・・。どっちを取るか、みたいなところが。まあ水匠だけでも、全然速くなりましたからね。水匠は今後はどうなるんですか?
杉村 あんまり更新することはなくなりますね。もう絞りきっちゃった感はあるんで。ただ新しい技術の方は改良点がいっぱいあるんで、どんどん強くなっていきそうです。いま多くの開発者はDL系に移行しちゃって。従来系で開発してるのは、強豪では1チームか2チームくらいになってしまうかもしれません。
渡辺 じゃあもう来年の大会は・・・
杉村 来年の大会はほぼ確実にDL系の優勝ですね。
渡辺 そしたらもうこういう(以前の普通のスペックの)パソコンでは動かないんですか?
杉村 そうです。パーツ(GPU)がないからですね。1秒100手しか読めなくて。それでも強いですけど、研究には全然適さない。
渡辺 じゃあみんなどうするんだろうな・・・
杉村 みんな買うんでしょうね、そのパーツ。
渡辺 昔、電王戦のときに支給されてたぐらいのパソコンだとどうなんですか?
杉村 最後(2017年11月)の電王トーナメントのときにはponanzaがGPUを使い始めるとか言い出したんで。ドスパラさん提供のマシンにGPUが入ったのは、その最後だけだったですかね。
渡辺 へえー。じゃあやっぱりみんな新しく買うんだ。
杉村 GPUはめちゃくちゃいいのを買ったら20万、30万はしますけど、それをもっと安くすれば5万とか10万とかでも十分かもしれません。
渡辺 じゃあこれからはそれを買えば十分みたいな。
杉村 そうですね。ただGPUが搭載されていないノートパソコンで、っていうのはもう厳しくなってくる。
渡辺 いまはもうノートでやってる人はあんまりいないですね。
杉村 であれば、GPU付きのパソコンを買えば。ただし、水匠が完全に廃れるかといえば、さっきみたいなこともありますし。DL系で終盤を強くするのは相当大変だと思うんです。
渡辺 でもレーティングでは水匠とか従来型は変わっていかないんですね。
杉村 そうですね。来年ぐらいにはもう、DL系の方がレーティングは伸びている。
松本 でもDL系だけで検討する棋士っていうのは、この先もそうはいないんでしょうね。
杉村 それはちょっとわからないですけど・・・。
松本 だって水匠の方が断然使いやすいわけですからね。
渡辺 まあ、使いやすいね。
評価値と「勝率」
松本 DL系使うにしても、やっぱりさっきみたいに並行してやらないと、落とし穴があるかもしれないから、怖いわけですよね。
杉村 うーん、そうですね。ただ逆にいえば、序盤の評価は水匠は全然適当だということがわかっちゃったので。
松本 そうかそうか。
渡辺 駒がぶつかる前ぐらいの話ですよね。
杉村 そうです。その段階でdlshogiは評価値200つけてるので。それで水匠が「1」とかだと、もうコンピュータ将棋だとdlshogiの勝ちになることが多い。
渡辺 それは僕らには関係があるのかな(笑)
松本 どうなんでしょう。使いようによっては序盤の研究には有利になるんですかね。
渡辺 早い段階で出してくれて? まあ、その手順が確立できればね。そこから追っていって、自分が真似できそうな手順が確立できればですよ(笑)
松本 この前の王位戦第3局で、途中までは豊島挑戦者よしと言われてましたが・・・。って私も速報記事に「逆転」と書いたんですけど、適切だったか、あとから反省しました。
渡辺 ああ、封じ手のところですよね。あれは確かABEMAのAIは(勝率)60%とか出してたと思うんですけど、あれはどうなんですかね・・・。逆転っていうか・・・。でも「藤井苦戦」ってコメントが出てましたよね。でもさすがに知っててやってるはありえないから。うーん、でもあれはね。後手からするとあれぐらいで60%という感じは全然ないんですよ。
杉村 ABEMAの「SHOGI AI」、評価値のスケールがちょっとデカいんで。水匠よりは出しますね。
松本 そうそう。私も水匠で並べてたんですけど、水匠だと200点ついてないぐらい。
渡辺 それって50何%でしょ? 正しくは。それで60%ってことはないですよね。
杉村 ABEMAさん、評価値と勝率をどういう計算式でやってるのか、教えてくれないから(苦笑)
渡辺 僕、調べたっていうか、こっち(水匠)と照らし合わせでいろんな将棋を見るたびに(勝率を)メモしていったんですよ。そしたら全然合わないんです。いろいろ途中でおおよその目安ができてきたんですけど、将棋によって全然合わなくて。「なんだこれ、どうなってんだ?」って思って。およそ60%で400点ぐらいと思ったら、全然合わなくて。
松本 なにか評価値だけではない、違う要素が入ってるんですかね。
杉村 それはほぼ間違いないと思います。
渡辺 藤井君の序盤の研究と、みんなわりと合わないんですよ。だから使ってるソフトがやっぱり違うんだろうなあ。
杉村 藤井先生、最近先手番相掛かりで絶対に(左側の端を突く)▲9六歩って指すと思うんですけど、それdlshogiの推奨手なんです。
渡辺 あっ、そうなんですね。それ、評価は高い戦法なんですか?
杉村 dlshogiは必ず▲9六歩と指します。
松本 なるほど、そういう時代なんですね。いま相居飛車の三大戦法は相掛かり、矢倉、角換わりと言われていますが。
渡辺 相手に常に3つ出すっていうのが大事じゃないですかね。準備が分散するから。永瀬、藤井、僕も3つ使うんだけど、豊島さんだけなんだよね、3つ使わないのは。先手番ではほぼ角換わりオンリーで。そこがちょっとタイプが違うんですよ。
松本 同じ相手と当たり続けると、やっぱり戦法のローテーションは難しくなりますか?
渡辺 うーんと・・・そうですね・・・。基本的にそうなんですけど、それを気にするタイプか気にしないタイプかあって。いまやってるのは永瀬、豊島、僕っていうのは、わりと戦法の注文をその都度出していくタイプなんですよ。その局において、今日はこれを持ってきました、みたいな。『いま僕にとってこの1か月、これがテーマです』みたいな感じじゃなくて。『この局はこれを持ってきました、はいどうですか?』っていうやり方。でもこれが一般的に主流だと思います。でも藤井君の場合、相掛かり始めたらずっと相掛かりやるじゃないですか。数か月間。っていうことは相手にとって相掛かりってほぼバレてるんですよ。たまに角換わりにサイクルが変わるんだけど、だけど相掛かりを続けているときは続くし、角換わり続くときは続くし。あんまり『今日はこれを持ってきました』というやり方はしないんです。相手を見て変えない。そこの違いはあるかな、っていうのはありますね。
松本 渡辺名人も短期間で同じ相手とよく当たった、という経験もあると思いますが。
渡辺 ただ、同じ相手とダブルタイトル戦はないですね。違う相手とならありますけど。相手が違うと全然戦型も違うし。そこまですごく困るってことはないですけど、同じ相手とこれだけ当たるとキツいでしょうね。昔の羽生-佐藤康光戦(2005年度に23局)とかね。
松本 王位戦第3局の封じ手。水匠は△9四歩。ABEMAは△5四銀でした。
渡辺 ABEMAは60%出してて、僕らはそれを見て、ああ、そういうもんか・・・と。後手玉は悪形がひどいんですよね。玉飛接近で人間がもっとも悪手が出やすいパターンで。これは後手が評価値が200ぐらいよくても、まあ指しこなせないでしょうね、みたいなのが僕の感覚ですね。だって▲4二歩みたいなのがあるじゃないですか。
松本 焦点の歩ですね。
渡辺 これ打たれたら(取り方で)常に三択なんですよ。逃げる手も含めたらもっとあるけど、相当キツい。この▲4二歩とか▲3三歩に対して間違えるのが、だいたい後手のパターン。本譜は評価値は互角ぐらいなんですけど、常に勝ちにくいんですよ。とにかく常に悪形だから。どっかで△8一飛みたいな感じで悪形が解消できればいいんですけど、なかなか・・・。
松本 なるほど。
渡辺 ソフトは△5八銀とかでいいって言うんだけど、だいぶ先まで行かないと、いいってことがわかんないんですよね。人間的にはせいぜい読めるのは10手先ぐらいまでで『はっきりしねえな』ってなったら却下するんですけど、これを20手ぐらい読んでいくと、はっきりじゃあ500(点)っていうのは人間でもわかるんですけど。でもそれはちょっと。藤井君とかでもそこまで読むのは厳しいと思います。
松本 水匠の評価値500は、自分が記事を書く時だと「少しいい」ぐらいのニュアンスで表現しますね。
渡辺 最近のソフトの500とかっていうのは僕らにとっては『えっ?』って感じなんです。『なんでこれが500も離れてんの?』みたいな。さすがに600とか700だと、人間でもわかるんですけど。やってるときに互角だと思ってたら、家に帰ったら500というのはザラにあります。『えっ、これ500なの?』みたいな。500はいまの評価値だと、人間だと互角ぐらいなのかな。
松本 なるほど。先手陣のスキに飛車取りに打つ△5八銀。これはわりと最初に目につく手じゃないですか?
渡辺 はいはい。人は△5八銀▲4八飛のあとに△4七歩成を読むんですよ。そうするとほとんど後手にはメリットがなくて。これはちょっと、知ってないとリスキーなので指せない。かなり勝負手ですからね。(事前に研究していていいと)知ってたら指せるんですけど(笑)。でもここはさすがに研究範囲じゃないから。これ研究してるのはマニアックです。他に研究すべき課題は山ほどあるし。しかもいまの二人のこのスケジュールだと、家で研究する時間、ほとんどないでしょ?
松本 なるほど。観戦者、とくにわれわれアマチュアはそうなんですが、ソフトの評価値、ABEMAの勝率表示を見ながらだと「藤井逆転勝ちなのかな」とどうしても思っちゃいますね。
渡辺 ああ、そうですね(苦笑)。でもやっぱり対局者とは体感が違うんじゃないですか。それと普段ソフトを使ってない人で、60%を何が意味するか、全然僕らと感覚が違うし。60%なんてザラに出すことは僕らはわかってるから。じゃあそこから人間がどれだけ勝ちきれるかってのは、それが無理だってこともわかってるし。
松本 2日目朝、ABEMAでは豊島勝率70%という数字は出ていたんだけれども、その一瞬という話ですよね。
渡辺 70%も出てました?
松本 出てましたね。
渡辺 うーん、でも対局者はそういう体感はないはずです。後手はうまくやっても勝ちづらさは残るから。
松本 終局直後「△4五銀出ればよかったんじゃないですか」って観戦記者から指摘があって、豊島挑戦者はびっくりしてましたね。
渡辺 まあそうでしょうね。でも記者の人が「△4五銀で後手がよかったですよ」って断言してくれた方がいいんです。それが控え室の検討なのかなんなのか、こっちはわかんないから。たまに(最善ではなく)全然違う場合があるんですよ。その先生の、その場の見解だったりすることがあるんで。
松本 それで最近では感想戦のときに「いい手なんですか?」と聞くわけですね。
渡辺 そう。「それ本当なんですか?」って感じで聞くと、「AIが言ってたんで」って言ってくれる先生もいるし。△4五銀がソフトの手なのか、その先生がいま思いついた手なのか、僕らは本当にわかんない。だってそれがわかっちゃったら、その対局者は強いじゃないですか(笑)。わかんないから、実戦で見送ってるわけで。
松本 △5八銀▲4八飛△4五銀は豊島挑戦者が驚いてるぐらいだから、相当見えづらい手なんでしょうね。
渡辺 じゃあなんでこれが見えづらいかってなったら、やっぱり後手の玉形がわるいから。▲6三銀みたいな(先手からの反撃の)手を読むんだけど、実際の評価より厳しく見えるんですよ、これが。(悪形の玉飛に)近いところを攻められるから、正しい判断ができないんですよね。
松本 なるほど、よくわかりました。
(次回、詰むや詰まざるや? その6に続く)