「ボナンザ VS 勝負脳」を読んでみた。

作者: 保木邦仁,渡辺明
出版社/メーカー: 角川書店
発売日: 2007/08
メディア: 新書
購入: 16人クリック: 2,027回
この商品を含むブログ (72件) を見る

将棋、人工知能の両方に興味のある人はもちろんのこと、将棋には興味があるが人工知能には興味のない人や、その逆の人が読んでも楽しめる本であると思う。

本書では、将棋ソフト「ボナンザ」の内部的な設計などについて述べられている。
ボナンザは独自の「評価関数」を持ち、全幅探索を行った上で最も評価値の高い手を打つとの事であるが、
「評価関数」などと言う単語はあまり聞きなれないものだと思うので、その辺りについて、かなり簡単にではあるがまとめてみる。

評価関数について

将棋の盤面を評価する評価関数Eが3つの変数X,Y,Zによって決定されるとすると、例えばEは以下のように書くことが出来る。 $\alpha,\beta,\gamma$ はそれぞれX,Y,Zの重み(各変数をどれぐらい重視するか)である。

$E(X,Y,Z) = \alpha X + \beta Y + \gamma Z$

ここで、X,Y,Zがそれぞれ以下を表す変数であるとし、具体的に考える。

Xは「王」に隣接する味方の駒数

Yは味方の全駒数

Zは相手の全駒数

X,Y,Zが上の様な定義の場合、例えば $\alpha$ の値が大きければ、「王」に隣接する味方の駒数を重視する、すなわち「王」の周りを味方の駒が取り囲むような戦略をとるようになる。また $\beta$ の値が大きければ、味方の駒をなるべく減らさないような防御的戦略になり、 $\gamma$ が大きければその逆で攻撃的戦略をとる。
この例では変数が3つしかないが、実際はさらに多くの変数によって評価関数を構成することで、より柔軟な戦略を表現する。
評価関数においては、 $\alpha,\beta,\gamma$ などの重みの値を適切に設定することが重要である。しかし人手でこれらを設定することは難しい(変数の数が増えれば増える程、難しくなる)。
そこで、 $\alpha,\beta,\gamma$ の最適な値の探索に機械学習を用いる、と言った具合である。