Bonanzaを読んでいます

fruitとcraftyの間くらいの読みやすさかな?
探索部分と学習部分は一通り読んだと思います。今のプログラムはbitboardではないので,そのあたりの処理は全く読んでいません。評価関数の項目はかなり少ないですね。pc_on_sqというのがなんの評価なのかパッと読んだだけではよく分からなかったのですが。とりあえず,いろいろ修正・効率化ができそうなので,学習をもう一度やり直してみたいと思います。

ペナルティについて

うーん,よく理解できていません。
http://d.hatena.ne.jp/ak11/20090131
このあたりでも詳しく述べられているんですが,論文とは結構違ってますね。

ペナルティの強さは、どうも相当強い気がします。

とあるのですが,ペナルティの値が固定で 0.5/FV_SCALE (=0.015625) ってことは,ほとんどないのと同じような気がするんだけどなぁ。同じやり方で持ち駒の枚数の価値を学習させてみると結構大きい値になるみたいだし。
ソースではわかりやすさ重視で簡略化しているのか,それとも論文よりソースのやり方のほうがいい結果が得られたのか,どっちなんでしょうね。

Bonanza 4.0.3

公開されましたね。まだあまり読んではいません。

学術的(?)には文句なしに有意義なことですよね。学習部分のソースも公開されているようなので,学習手法の提案・改良をしたときには,オリジナルのボナンザメソッドとの性能比較とかもしやすそうですね。
 あと,将棋ソフトもちゃんとしたものを作ろうとするとそれ自体結構時間のかかる作業になるので,手軽に実験を行えるソースがあるというのはありがたいと思う。というか,変な自作ソフトでとった実験結果より,Bonanzaでとった実験結果のほうがずっと信頼できるし。

選手権のライブラリという観点では,まぁいろいろな考え方がありますね。
 オリジナリティについては,今まで通り緩くやればいいと思う。というより,そもそも現行の仕組みでは出場したプログラムを失格にするというのは難しい(無理だ)と思う。ライブラリとしてはRejectするべきだったのでは,といった意見もあるようですが,コンピュータ将棋の発展ということを考えるとやはりそういうわけにもいきませんよね(これだけのことをしようとしてくれている保木さんにも失礼な気がしますし)。
 まぁ確かにライブラリとしては使いにくいと思います。Bonanzaを使う以上,最低でも決勝進出を争うくらいの成績は残さないとおかしいし,良い成績を残したとしても「こいつほんとに自分でなんかしたのか?」みたいな目で見られることは確実だし。

ということで,多くの人が参考にはするけどライブラリとして使う人はほとんどいないんじゃないかな,と思います。

確率探索の方が強い…かな?

eloレーティングがいかにも実現確率に使えそうな感じなので,ちょっと試してみました.もとがPVSなので,深さの部分を実現確率に変えるだけですね.

自己対局では,(1手2秒,1手10秒ともに)実現確率を採用した側が6割くらい勝ち越しているようです.ちなみにSEEを重複して計算しているような超適当実装なので,npsは全幅に比べて相当低いです.まじめに実装すればもう少し勝率は上がるのかも.

実装としてはモンテカルロ将棋のときに求めたレーティングを利用して,深さの消費が1/2〜2倍(※このあたりも適当ですが)になるようにしただけです.枝刈りはfutility pruningとnull move pruningは適当に使っていますが,全幅探索のほうでやっているhistory pruningやあやしげな延長,reductionなどは行っていません.

実装面や枝刈り,実現確率に用いる指し手の分類など,改善の余地がかなり残されていそうな感じなので全幅より実現確率のほうが強いのかもしれませんね.

GPW2008

優秀論文賞をいただきました.ありがとうございます.
これからも頑張っていきたいと思います.

他の発表について

モンテカルロの話題が中心だったので,理解しやすい発表が多くとても楽しめました.(将棋の発表は少し少なく感じられましたが…)
個人的に特に興味深いと思った発表は,竹内さんの探索の性能評価の話,北川さんのUCTの枝刈りの話,金子先生の学習の話などです.やっぱり数学的なバックグラウンドの差は大きいなぁとか思ってしまったり.

あと,Aリーグの伊藤さんは話(講演)が上手だなぁと思いました.そのプレゼン能力でどこからかハードにかけるお金を….

GPW杯について

プログラムの改良のほうはあまり進んでいないので,参加しようか直前まで迷っていたのですが,YSSに一発入れただけでも参加してよかったなぁと思います.4強と言われている時代ですが,長年トップレベルの座に居続けるYSSは特別な存在だと思ってます.まぐれだとしても当然嬉しいです.

ちなみに人間(東大将棋部)には学習の悪い癖が出て大駒を切りまくってサクッと負けました.
強いときと弱いときの差が激しすぎるのが問題ですね….山本さん,次回会うことがあったらリベンジさせてください(笑).

いろいろ面白い話も聞けて,これは強くなるに違いないと思っていますが,実際なかなかそう簡単にはいかないんですよね.

GPW

GPWですが,30分の口頭発表で採録されています.
モンテカルロ木探索によるコンピュータ将棋ということで,将棋・囲碁両方の方々から叩かれることが予想されますが,どうぞお手柔らかにお願いします(笑).内容的には,このブログに書いた話から書いていない話までいろいろありますので,興味を持って聞いてもらえるよう頑張りたいと思います.
スケジュール案によると最初の予定なのですね(まだ変更の可能性もありますが).少し緊張しますが,あとの発表はじっくり聞くことができていい感じですね.…というか本当にモンテカルロの文字ばっかりで,数年前では考えられないようなプログラムですね.恐ろしい.