音声認識とは、コンピューターによって人間の発する「声」を「文字」に変換したり、発言者を特定したりする技術です。この技術により、キーボードなどを使って文字を入力していた従来の方法に代わり、声だけで文字の入力が可能になりました。人間が発する言語には、方言やなまり、話すスピードなど様々な特徴があり、認証の精度を上げるためには大量の音声データが必要で、それぞれ適切な形にデータを加工する必要がありましたが、ディープラーニングを活用することにより、データ作成の手間が大幅に軽減され、音声認証の正確性は飛躍的に向上しました。
AI(人工知能)用語一覧へ戻る
用語