来年は…

うさぴょんの開発が行き詰ってきているので、時間に余裕があったら、れさぴょんもベースにしないで書き直して…Infinity Redという名前で参加しようかなぁ…。

元々、別のネタのために温めておいた名前なんですが。

もう、時効だろうw

| | コメント (0) | トラックバック (0)

れさぴょんとBonanzaの指し手の生成速度について

http://d.hatena.ne.jp/LS3600/20091111

で詳細が触れられています…というよりも、糾弾されているという感じですが、れさぴょんの手生成はあまり早くはないと自覚しています。

…と宣伝してみました(苦笑)。

差し手その他の高速化にどこまで突っ込んで行くべきかと言うのは、非常に色々な考え方がありますので、「れさぴょんの方法は早くないよ」と知らせておくに留めます。

れさぴょん本には、チェス関係のサイトへのリンクを記述することでヒントは十分に与えていると思っていますが、今はBonanzaのソースが入手出来るようになったので、れさぴょんを卒業したらBonanzaを読め、ということになりますかね…。

本の内容は増刷のタイミングくらいでしか変えられないのですが、また増刷することになればこのあたりの情報へのリンクも行うことが出来る…かな?そもそも、BonanzaMethodに触れていない時点で「れさぴょん」本は既に時代遅れかも知れません。ただし、この位から入らないと敷居が高くて厳しい、という位置付けでそもそも書いた入門本(コンピュータ将棋の進歩シリーズの前に読むべき本)、入門用コードなので、分かり易さを優先してあんなものでよい気は今でもしています。

| | コメント (4) | トラックバック (0)

退院してきました

40日間も入院してたんですが…過ぎ去るとあっという間です。

現在、請求書の金額をみて、入院の長さを実感しています(苦笑)。

お金、どうにかしないとね(^^;

うさぴょんをお金に変換することも検討してみないと。でも、もしも別途有料版を作って配布したとして…買ってもらえるんだろうか?

やっぱり、『弱さの実現』がテーマかな。人間らしく見落としてみるとか、ね。

| | コメント (9) | トラックバック (0)

「うさぴょん」のキャラクターデザイナーのブログ始動。

私の入院中に、「うさぴょん」のキャラクターデザイナーのブログが始動しました。そのうち、HPからもリンクすることにしておいて、まずはご報告をば。

アレコレ脱力生活 ~絵本のある暮らし

脱力系主婦の日常を取り巻くいろいろなモノを絵本・書籍を中心に紹介しています。

http://henohenomo.blog83.fc2.com/

…というわけで、こちらの鬱病日記が楽しくない方は、上記サイトの脱力感を楽しんで下さいませ。

開発ブログを書く人間もいれば、脱力系主婦もいれば、鬱病とのおかしな闘病記を書くヤツもいる、うさぴょんの開発チームに加わって、君も「どこか変な人」になろうw
  <全く勧誘する気のない勧誘

| | コメント (5) | トラックバック (1)

恥ずかしい写真

Kuronekonyacaren

左の写真は、去る2009年6月20日に行われた、CGFオープンの9路盤での黒番「caren」、白番「くろねこにゃ」の戦い…になってない様子です。

(なお、写真提供は、YSSと彩の作者の山下さんです。)

棋譜を残し忘れたので、お見せするのに時間がかかってしまいました。

ちょっと設定を間違えて、MCの中で使うパターンデータベースファイルとして、変なデータを読み込んでしまい…結果として、毎回のMCによる終局までのシミュレーションの結果がメチャクチャになり、こんな惨状が起きてしまいました。

この局面を写真に撮って貰った直後、プログラマーの判断で投了したのですが…もしも、最後までやったら、どうなってたのかな…とか、今更考えてみたり。

| | コメント (2) | トラックバック (0)

もう少しメモ

gpsでは、実現確率を二つ使っている。

一つは、枝刈用の実現確率

もう一つは、本来の意味での実現確率=その手を指した時にdepthに足す値(あまり正確な言い方じゃないけど、自分用のメモなので勘弁)

静止探索は、YSSの残り深さxで読む手、を参考に作成&KFEndを参考に、脅威を評価。

| | コメント (1) | トラックバック (0)

GPS将棋の発表から得たヒントなど

ほとんど個人的なメモです。

…Bonanza Methodを一度は実装した経験がないと意味不明だと思う。

  • Bonanza Methodで『進行度』の計算の仕方を調整
  • 『進行度』を学習する時は、他の特徴量の学習はOFF
  • 序盤/中盤/終盤に評価関数を分けている。ここで、進行度を0~1とすると、例えばある局面の評価値は、
    • 0<=進行度<0.5 の場合 序盤の評価関数×(0.5-進行度)+中盤の評価関数×進行度
    • 0.5<=進行度の場合 中盤の評価関数×(1.0-進行度)+終盤の評価関数×進行度
    のように求めている。
  • Bonanza Methodを行うにあたって、特徴の変更中にPVが変わらないという(かなり強い)仮定を置いている。
    全てのPVを求めて保存→各局面に対してBonanza Method実行を50step程度(これで大体値が収束)
    再びPVを求めて保存→Bonanza Method実行…の繰り返し。
    毎回PVを求める方法と比べるとかなり高速化が期待できそう。
  • 静的探索の中では、stand-patする際に脅威を評価しているが、学習用では普通にstand-patしている。やはり脅威の評価をするとうまくPVが求められなかったりとかややこしい問題に突き当たったそう。(うさぴょんもそれではまった)
  • Bonanza Methodの実行中、慣性項(のようなもの)を持たせて、同じ方向に特徴が動く場合には、大きく動かす。正負が逆転する場合には、直前の学習が過学習だったのではないかと看做して、前回のイテレーションでの増分値の半分だけ戻すなどの工夫を行っている。他にも怪しいヒューリスティックスが入っている(ある条件化で、全ての特徴を全部1/8にするとか)ので、詳しい条件は、gpsshogiの学習部分のソースを読むべし。
  • featureを考えるのは、将棋四段位の人の仕事。ただし、最初は考えたfeatureを入れても強くならなかったそうで、こういうfeatureが足りないからこういう手が指せないとかここで受けに回れないとか、そう言うのはプログラミング的な知識と将棋の知識と両方がないと非常に難しそう。
  • 棚瀬さんの意見では、将棋の知識は初段位あればいいんじゃないかとも言っていたが。
    • 余談として、保木さん=将棋倶楽部24でR500位だと、へぼい道場だと初段相当だとか(^^;
    • R250のオレはどこへ行けばいいのやらwww
  • 特徴を追加・学習した場合、中盤の10局面を用意し、先後を入れ替えて各々一手30秒で直前のバージョンとの自己対戦でチェック/stableなバージョン(手で評価値を調整したもの)との対戦でチェックし、両方に対して13勝7敗(これだと本当は有意性が足りないみたいだけど)以上しない場合、その特徴はReject
  • さらに、featureを追加した四段程度の棋力の人が棋譜を見て、変な指し手がないかどうかチェック。あからさまに変な指し手がある場合にはやはりReject or 再学習
  • 上記のようにしないと、超攻撃性が高い個体が攻撃性の高い個体に勝つというような現象が起きるそう。
  • そして、超攻撃性の高い個体は、うさぴょんみたいなのにもぽろっと負けたり、と。
  • 実際、自己対戦は危ないよなぁ…<個人的経験から。

用語とかは全く正確じゃありませんw 特に、『Bonanza Methodの実行中』と言うのは、本来の意味だと『PVを求める部分』と『PVに対して特徴ベクトルの調整を行う』のは一つの処理のはずなので。上記では、『PVに対して特徴ベクトルの調整を行う』部分のみを指して『Bonanza Methodの実行中』とか言ってたりします。

進行度の調整の仕方に関しては、序盤・中盤・終盤の評価関数がある程度ちゃんとしてからでないと進行度が計算出来なさそう。

| | コメント (0) | トラックバック (0)

ぽかーん…

この記事を書いている時点で、第19回コンピュータ将棋選手権で優勝した、GPS将棋が、floodgateにおいて、51勝1敗、将棋倶楽部24換算したレーティングでは3000超え。(Bonanzaが選手権と違って1コアなのかも知れないけれど)Bonanzaにも大きく勝ち越しています。

どこかで『今年の優勝はじゃんけん勝負のような感じで、どこが優勝しても別におかしくはなかったんじゃない?』と発言したのですが、上記を見た感じだと、優勝するべくして優勝したとしか言いようがないです。

これは、持ち時間が極端に短い将棋(例えばNHK杯のようなルール)だと、(研究されるまでは)プロにも勝ち越しかねないのでは…。多分、対局している内に人間側が『癖』とか『悪い定跡選択をさせる』とかですぐに勝てなくなるのでしょうけれども。

動かせる環境が限られているので、Bonanzaが現われた時程の衝撃はなかなか普通の人には与えられないのでしょうが、この勝率は凄すぎる…。

| | コメント (1) | トラックバック (0)

選手権、行って来ました。

第19回コンピュータ将棋選手権、参加してきました。

二次予選からの参加で、4勝5敗。二次予選24チーム中18位。

…昨年と同じ成績です。

午前中は、駒組関連のプログラムがバグっているのに気が付きませんでした _no

「みさき」とやってる時には全然気が付かず、「臥龍」とやっている時にも気が付かず…SPEARとやってる時に、すげー変な手を指し初めて気が付きました… _no

あまりの変さ加減に、SPEARの開発者のグリンベルゲンさんには

『ここからSPEARが負けたら、もうコンピュータ将棋の開発は辞めま~すw』
とか言われる始末…(苦笑)。

ちなみに、上を言われたのは、ここの棋譜の23手目の局面。 17手目が既に変で、二人で笑い出したのですが、致命的に変だったのは23手目です。

その後、ようやっとバグも治ったかと思って迎えたのが、最終のTACOS戦。

…まだこれから難しい捻り合いが延々と続くんだろうなぁという局面で、TACOSがバグで停止してしまい、反則勝ち。

駒組みが変かどうかは、TACOS戦は定跡手順で大分進んでしまったので不明…。

まぁ色々課題があったり、色々知見があったりしたのですが、徹夜で寝ぼけてるので今日はこの辺で…。

| | コメント (2) | トラックバック (2)

学習のバグは取れそうだけど

学習結果を収束させるのに、回しっぱなしでも120時間位かかりそう(--;

というわけで、うさぴょん2は諦めましたw

うさぴょんで出るなら、後は細かい調整をするだけなんで、明日は見学に行くかなぁ。

| | コメント (2) | トラックバック (0)

«うさぴょん2 半ば ギブアップ