基本情報科目Bサンプル問題：問15　三目並べゲームAIの秘訣　評価値を用いた最適手決定

基本情報技術者

2023.06.052024.08.21

この記事は約4分で読めます。

記事内に広告が含まれています。

三目並べの手を決定する評価値の計算：基本情報技術者試験科目Bのアルゴリズム問題

本記事では、基本情報技術者試験の午後試験で問われるような、ゲームAIの一部として利用可能なアルゴリズムについて詳しく説明します。具体的には、三目並べのゲームで次の手を決定するために使用する評価値を計算する手順について解説します。

ステップ1：評価関数とその必要性
ステップ2：評価値の計算
ステップ3：ミニマックスアルゴリズムと評価値
ステップ4：評価値に基づく次の手の決定
ステップ5：評価関数の改良
まとめ

ステップ1：評価関数とその必要性

評価関数は、ゲームの状態（三目並べの場合はボードの状態）を評価し、その状態がどれだけ「良い」かを数値で表現する関数です。良い状態とは、プレイヤーにとって有利な状態を指します。評価関数の値が高いほど、その状態はプレイヤーにとって有利であると判断します。

ステップ2：評価値の計算

評価値は、ボード上の各セルの状態に基づいて計算します。具体的な評価方法は様々ですが、一般的な手法の一つは、自身が勝つ可能性が高いライン（縦、横、斜め）の数をカウントするものです。

def evaluate(board, player):
    winning_lines = [[(0, 0), (0, 1), (0, 2)],
                     [(1, 0), (1, 1), (1, 2)],
                     [(2, 0), (2, 1), (2, 2)],
                     [(0, 0), (1, 0), (2, 0)],
                     [(0, 1), (1, 1), (2, 1)],
                     [(0, 2), (1, 2), (2, 2)],
                     [(0, 0), (1, 1), (2, 2)],
                     [(0, 2), (1, 1), (2, 0)]]
                     
    score = 0
    for line in winning_lines:
        if board[line[0][0]][line[0][1]] == board[line[1][0]][line[1][1]] == board[line[2][0]][line[2][1]] == player:
            score += 1
    return score

この関数は、現在のボード状態（2次元配列）とプレイヤーのシンボル（通常、”X”または”O”）を引数にとり、プレイヤーにとって有利なラインの数をスコアとして返します。評価値が高ければ高いほど、そのプレイヤーにとって有利な状態であると判断します。

ステップ3：ミニマックスアルゴリズムと評価値

ミニマックスアルゴリズムは、評価値を用いてゲームの最善の手を決定するためのアルゴリズムです。全ての可能なボードの状態を試し、それぞれの状態について評価値を計算します。このアルゴリズムは、相手が最善の手を打つと仮定し、その中で最も評価値が高くなる手を選びます。

ステップ4：評価値に基づく次の手の決定

評価値を基に、次に打つべき最善の手を決定することができます。これは、ミニマックスアルゴリズムの一部として、あるいはそれ自体で行うことができます。具体的には、可能な全ての手を試し、それぞれの手がもたらす新しいボード状態の評価値を計算します。最も評価値の高い手を選択します。

ステップ5：評価関数の改良

上記の評価関数は非常に単純なもので、実際のゲームではさらに複雑な評価関数が用いられます。例えば、自身が直接勝つことが可能なラインの数だけでなく、相手が次の手で勝つ可能性があるラインの数を減算するなど、評価関数を改良することが可能です。

まとめ

三目並べの評価関数の作成は、ゲームAIを理解する上での重要なステップです。評価関数を理解し、改良する能力は、基本情報技術者試験の科目B試験だけでなく、一般的なAIやゲーム開発においても非常に価値のあるスキルです。これらの知識を活用して、さらなる学習と実践に挑みましょう。

問題演習で知識を定着させましょう。

サンプル問題問15

基本情報技術者試験　科目Bのサンプル問題でアウトプットしよう
 解答はこちら