第18回世界コンピューター将棋選手権の棋譜を再現したり、ブログなどを読んだりして、昨年読んだあるアルファブロガーのエントリを思い出していた。
電脳がいつかは人脳に勝つ理由 - 書評 - ボナンザVS勝負脳
ボナンザのすごいところは、強いこと、ではない。どうやって棋士の経験から学ぶかということを定式化したことなのだ。これが意味するところは、「強いプログラム」を作るとは全然違う。「プログラムを強くするにはどうしたらよいか」ということを発見したに等しいのだ。
そのためには、過去の棋譜をどんどんプログラムに食わせればいい。プログラムは、食えば食うだけ強くなる。
コンピューター将棋選手権ネット中継のブログの開発者コメントで以下が目に留まった。
「2年前に優勝したときは1敗、去年は2敗、そして今年は3敗で段々苦しくなってきたかなと。学習の方法を公開しなかった方が良かったなと後悔しています(笑)」(Bonanza開発者の保木邦仁氏)
「決勝リーグの8チームのうち5チームが学習を取り入れていた。(成績表を見て)評価関数より学習の方がいいのかなと思った」(YSS開発者山下宏氏)
「学習は形は崩れないので優秀なのかなと思った」(備後将棋開発者の恩本明典氏)
筆者はAIのことはほとんどわからないが、これらから窺えるのは、保木氏が Bonanza で使った学習法を公開をして、その方法を大なり小なり取り入れることで、今回の選手権までに実力を大幅にアップさせた将棋エンジンが増えたということのようである。
プロ棋士の過去の経験から学習をしているのだとすれば、コンピューターがプロ棋士のレベルまで到達することは容易に想像できるのだが、その先はどうなのだろうか。何かもうひとつブレークスルーがないと論理的にいって人間より強くはなれないような気がするのだが。尤も実戦的には、コンピューターが過去の人間の経験をすべて血肉化すれば、心理戦が通じない分、百戦百勝ということになるのかもしれない。
コメント