表記ゆれ

表記ゆれとは、日本語や英語などの言語において、同一の意味を表す際に複数の言い回しや異なる表記が存在することを言います。例えば、「メモリ」と「メモリー」、「パソコン」と「PC」はそれぞれ異なる表記ではありますが意味は同じです。
AIチャットボットなどの会話型のサービスでは「おっはー」「おはよう」「おはようございます」といった同一の意味に捉えてほしい異なる表現の言葉や、スペルミス、変換ミスなどに対しても表記ゆれと表現することがあります。

ビッグデータ

ビッグデータとは、購買履歴や位置情報、SNSやブログの文章、画像、動画などインターネットやスマートフォンなどから得られる膨大なデータのことを指します。インターネットやスマートフォンの普及により、様々な情報がデータとして残るようになったことで、膨大なデータを「資源」として活用し、研究やビジネスに役立てようとする動きが広がりました。

これまで、あまりにも膨大な量のデータのためコンピューターでも処理しきれなかったビッグデータですが、AIによる機械学習やディープラーニングの技術発展により分析や管理が可能になりました。総務省は平成29年度版情報通信白書において、2017年を「ビッグデータ利活用元年」と呼んでいます。

パターン認証

パターン認証とは、多くの人が行き交う中から友人を見つけることができる、といったように人間が日常的に自然に行っている「ある特徴を手掛かりに、求めているものを探し当てる」行動のことを指します 。文字認識や顔認識、音声認識などがこれに当たります。パターン認証を機械学習と組み合わせたことにより、数式や記号で表せないこれらの情報を分類することができるようになり、顔認証や音声認証などの技術が大きく進歩しました。