エンターテイメントと認知科学研究ステーション/講演会/20060821

TOP > 講演会 > 2008-06-14

第5回講演会

・第5回招待講演会

開催日：2008年６月１４日（土）13時から18時頃まで
場所：電気通信大学　西９号館３階ＡＶホール
参加無料（事前申し込み不要）

-------------------------------------------------------------------------
13:00-14:30
　「コンピュータ囲碁におけるモンテカルロ法」（理論編）　←発表資料
　　美添一樹氏（科学技術振興機構　研究員）

概要
　囲碁は，主なボードゲームの中でコンピュータの挑戦を拒み続けてきた唯一の
ゲームである．囲碁の難しさは良い評価関数を作ることが困難であるということ
に起因していた．
　しかし2006年にコンピュータ囲碁の世界に全く新しいアルゴリズムがもたらさ
れた．評価関数が不要という画期的な探索アルゴリズム，通称，モンテカルロ木
探索と呼ばれるものである．登場から2年あまりで9路盤ではプロ棋士を破るほど
の強さを獲得し，19路盤での棋力も従来のプログラムを上回るようになった．
　そのアルゴリズムの性質や理論的背景について述べる．また，現在どのような
工夫が行われているのか，簡単に解説する。

-------------------------------------------------------------------------
14:40-16:10
　「コンピュータ囲碁におけるモンテカルロ法」（実戦編）　←発表資料
　　山下　宏氏（囲碁プログラマ）

概要
　モンテカルロ法を利用した囲碁プログラムが数年前に登場して以来、囲碁プロ
グラムの棋力は急激に伸びて9路ではプロを、19路では既存の最強プログラムに
8割以上勝つソフトが登場しました。私が作成している「彩」もモンテカルロ法を
利用することによって急激に強くなりました。
　ここではモンテカルロ法を利用した囲碁プログラムの作り方を具体的に解説し
ます。内容はデータ構造、plyaoutとは、3x3のパターンの利用、UCTの利用の仕
方、探索回数と棋力の変動、RAVE、作っていて悩んだこと、などをサンプルコー
ドを交えながら解説していきます。

-------------------------------------------------------------------------
16:30-18:00
　「５五将棋における評価関数の自動学習」　←発表資料
　　柿木　義一氏（将棋プログラマ）

概要
　５五将棋において、形勢を数値化する評価関数をBonanza Method によって自動
学習した。Bonanza Method では、エキスパートの大量（数万局程度）の棋譜を
使用する。しかし、５五将棋では、エキスパートの大量の棋譜がないので、自己
対戦の棋譜を使用した。学習した評価関数を使って自己対戦し、その棋譜を使っ
てさらに学習していく。
　この評価関数を使ったプログラムで参加した第１回UEC杯５五将棋大会では、
５勝１敗の準優勝となり、ある程度妥当な評価関数が作成できたと考えている。
　エキスパートの大量の棋譜がない５五将棋以外のゲームでも、自己対戦の棋譜
を使用することによって、Bonanza Method は有効であると考えられる。
　参考のページ：http://remi.coulom.free.fr/Hakone2007/