コーパス

日本語や英語などの自然言語の例文集を、自然言語処理を行うために集めたもののことです。AIチャットボットなどで日本語の自然言語処理を行う際には、一般的に質の良いコーパスが多ければ多いほど回答の精度が向上します。

形態素解析

形態素解析とは、自然言語処理で行われる処理の一つで、日本語や英語といった自然言語の文章を「意味を持つ最小の単位」に分割する手法のことです。形態素解析を行うことにより、その文章にどのようなキーワードや意味が含まれているかをコンピューターが判断し、文章から情報を取得することが可能になります。

教師なし学習

教師なし学習とは、機械学習における学習手法の一つです。分析対象のデータのみをあたえ、正解データは与えずに学習を行います。コンピューターが、入力されたデータの持つ傾向や規則性を見つけ出したり、共通する特徴ごとに分類などを行います。

教師なし学習は、膨大なデータの中から傾向や構造を抽出するため、人間には発見できないような未知の相関関係を見つけることを得意とします。

教師あり学習

教師あり学習とは、機械学習における学習手法の一つです。例えば、ある問題を解く場合に、人間があらかじめ設定した「正解データ」とともにデータをコンピューターに学習させることでコンピューターが意図したとおりに問題を解くことができるようになります。このように正解付きのデータのことを「教師データ」と呼びます。

教師あり学習は、一般的に過去のデータをもとに将来の予測を行うため、迷惑メールのフィルタリングや天気予報、株価予測などに応用されています。分類問題に強く、正解データがない推論、分析などの分野では利用ができません。また、教師データの質や量によって、コンピューターの識別能力に大きな差が生じます。

強化学習

強化学習とは、機械学習における学習手法の一つです。「教師あり学習」では、入力データと正解データのセットを学習させ、予測した答えを出力しますが、強化学習では明確な正解がない場合に、最適な答えを選択するように学習します。AIが特定の行動を選択した結果、発生した環境や状況がAI自身にとって望ましいものか、望ましくない結果であるかをAIが自分自身で判断することで、より望ましい結果を見つけ出していくアプローチをとる手法です。

2016年に囲碁の世界王者に勝利したことで一躍有名になったイギリスのDeepMind社の囲碁AI「AlphaGo」はこの強化学習が用いられています。膨大な囲碁の組み合わせパターンをすべて探索するのではなく、どの手を打てば「勝ちに近づく最適な行動がとれるのか」を繰り返し学習させることで、人間にも勝つことができる囲碁AIが誕生しました。

機械学習

機械学習とは、AI(人工知能)の研究領域の一部であり、コンピューター(機械)にデータを読み込ませることで、与えられたデータのどの部分に着目すると求められている処理を期待通りにこなすことができるのかを、機械に自動的に学ばせることを指します。機械がデータをもとに課題の解決方法を自力で「学習」することから、「機械学習」という名称が与えられました。

機械学習には「教師あり学習」、「教師なし学習」、「強化学習」という3つの手法が存在します。機械学習によって見つけ出した特徴やパターンを用いて、新しいデータの分析や予測を行うことができるようになります。

画像認識

画像認識とは、AIの活用分野の一つです。対象の画像に映っているものを特定したり、識別したりすることができます。画像認識の正確性はディープラーニング技術の進歩により飛躍的に向上しました。

画像認識は、工場での不良品検知や顔認証システムなどに活用されています。