コンピュータ囲碁で44%のポリシーネットで打てるようになりました
土日はコンピュータ囲碁のプログラムを考えていました。座標の扱いが間違っているだろうと思っていたが、(x,y)とするべきところを(y,x)と逆にしていたので動作がおかしかったのだ。それを直したら44%のポリシーネットの最も確率が高いところに打つ、という機能を実装することが出来ました。
あとはそれをモンテカルロ法と組み合わせて、ポリシーネットの確率がバラけているときはモンテカルロ法の結果を採用するというようにしてみたらポリシーネットだけより強くならないかなと思って試しているところです。
- 2017/09/24
- デジタリアン
- 固定リンク
- トラックバック (0)
- コメント (0)
- ↑
コメント一覧