LMRと実現確率の併用

金子さんが補足してくださっています。

http://www.sgtpepper.net/kaneko/diary/20091118.html

注目するポイントは、実現確率を決める際に指手単独についてのみ見ていると、良さそうに見える手が沢山ある局面と、他に有力な候補がない局面で、同じ確率がつくという点です。同じ確率が良いのかどうかは別に議論が必要ですが、LMR風の考え方を取り込めば前者の確率は下げられます。という背景で、GPS将棋は、ロジスティック回帰が(他の手をみないで)出してきた数値順に全合法手を並べた時の順位やトップとの差なども考慮して確率を決めています。

同じ確率が良いかどうかは場合によりけりな気がしますね。同じ「歩を取る手」でも、ほかの指し手に有力なものがない場合と、例えば「飛車を取る手」などの手がある場合では、探索深さに違いが出てほしいというのはもっともだと思います。一方で、本当に(同じくらい)有力な手が複数あった場合には、どれも深く探索した方がよいと考えられます。ただ、実現確率がそこまで正確なものかといわれるとちょっと自信がないので、GPS将棋のようにした方がいいのかもしれませんね。GPS将棋はトップとの差まで考慮しているということで、かなり凝った実装になっていそうです。今回の発表の手法ですが、killerやhistoryを考慮することは、一応、間接的に他の指し手との比較も行っていることになるかと思います。

確率の精度改善

  • 指し手の情報そのもの
  • 移動元の3x3パターン
  • 移動先の3x3パターン

などの膨大な特徴を入れてみました。激指にはまだかなわないのですが、一致率はかなり向上して、序盤〜終盤通して30%以上は出るようになってきました(必ずしも一致率の向上=強さの向上とはいえないです。)。学習データを増やせば、もっといきそうです。やはり、駒の損得+簡単な将棋の特徴だけでは一致率は20%台が限界のような気がします。