用語

強化学習

強化学習とは、機械学習における学習手法の一つです。「教師あり学習」では、入力データと正解データのセットを学習させ、予測した答えを出力しますが、強化学習では明確な正解がない場合に、最適な答えを選択するように学習します。AIが特定の行動を選択した結果、発生した環境や状況がAI自身にとって望ましいものか、望ましくない結果であるかをAIが自分自身で判断することで、より望ましい結果を見つけ出していくアプローチをとる手法です。

2016年に囲碁の世界王者に勝利したことで一躍有名になったイギリスのDeepMind社の囲碁AI「AlphaGo」はこの強化学習が用いられています。膨大な囲碁の組み合わせパターンをすべて探索するのではなく、どの手を打てば「勝ちに近づく最適な行動がとれるのか」を繰り返し学習させることで、人間にも勝つことができる囲碁AIが誕生しました。

AI(人工知能)用語一覧へ戻る