囲碁のValue-netを作ることに多分成功したんじゃないかと思っている
↑中盤の数値540がlabel(勝率、黒番の勝率を1000倍している)。Xが入力データ(盤面)、Predicted label 607がモデルから予想した勝率(黒番の勝率を1000倍している)。
Ubuntu17.04でPython3でチェイナーを使って山下さんの公開していたデータから学習させて「盤面を入力すると黒番の勝率を返してくるモデル」を作って予測することが出来たと思う。
現状の問題点として、これPythonでしか動かない。それなので、今後の課題としてこのモデルをC++から使えるようにすること、ということがある。これもまた難題っぽい。BoostというのでPythonとC++をやり取りできるというふうにSDTのときに教えてもらったので試しているがなんか動かないのだけど。
ただ、Value-netを作る技術を確立できたらしいということは個人的に大きいと思う。これまではそれさえできなかったのだから。作り方さえわかればあとは量を稼げば精度は上がるはず、とは思う。
- 2018/01/12
- デジタリアン
- 固定リンク
- トラックバック (0)
- コメント (0)
- ↑
コメント一覧