2023年9月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

最近のトラックバック

無料ブログはココログ

« 2009年1月 | トップページ | 2009年4月 »

2009年3月25日 (水)

学習失敗、というか何と言うか。

9路盤の学習、先の通り、してみました。

結論から言うと、一部成功しているものの、明らかに弱くなっています(爆)。

成功例ですが、例えば、いきなり盤の端に打つような変な手が明らかに減っています。

が。

プレイアウトの中で盤の端に打つ手の確率も減っているようで…そうなってしまうと、盤の端まで追って行って石を殺すことがMCの中で出来ません(爆)

石を取る手があったら優先的に読むとか入れていこうとすると、処理がえらい重くなるのも分かっているので…さて、どうしたものか(--;

2009年3月24日 (火)

次はうさぴょん2の学習

とりあえず、全幅探索にするのかどうかはまだ置いておいて…。

現在、評価関数の自動調整に挑戦しています。

ニ駒の位置関係と、玉を含めた3駒の位置関係、玉の周りの利きの数をとりあえず評価関数の組み込みデータにしようとしています。なお、駒割は、現在のままで、学習しない方向です。

さて、今回、学習で問題になったのが、うさぴょんの静止探索。

元々Odd/Even Effectが大きいのは分かってたのですが…これは酷い(苦笑)。

しばらくまわしてみて、収束していく雰囲気がない(爆発)

というわけで、そんな基本的な部分から作り直さないといけないだろうなぁと思う今日この頃…。

ちなみに、学習する前の状態では、くそ重い手の評価を用いており、『手の評価関数』では、最善手よりも前に来てしまう手の平均は5~6前後でした。これから、どれ位減るんでしょうかね?

九路盤で学習してみました

…データとしてよいものが取れているかどうかはまだ謎ですが。

方法は、基本的に棋譜からの学習なのですが、自己対戦から3x3のパターンを切り出し、パターンの登場頻度と実際にそこが最善手として打たれた回数を求めて、回数/頻度をMC部の中で確率として使うようにしてみました。

さて、『完全ランダム』なMC部と、頻度を考慮したMC部とで、どちらが強くなっているか、実験ですね。

今回は、単純にパターンを抜き出したのですが、厳密には、

・その着手で石が取れる場合/取れない場合

・その着手でダメが増える/増えない

などを考慮しないと、何となくまずいことになりそうです(--;

 <ちょっと実験してみた感じだと、どうも何かおかしいような…。

« 2009年1月 | トップページ | 2009年4月 »