人工知能オンラインは、人工知能時代を乗り越えるため、国内外で利用される人工知能についての情報を発信しています。

AIが人間のように会話するとき

前のページへ戻る

自然言語とコンピューター

人間が話す自然な言葉を自然言語と言います。この自然言語をコンピューターが理解し始めた時、AIの時代が到来する未来を予感できます。

コンピューターは自然言語を理解するだけではなく、会話を聞き取り、そして返事をしなければなりません。聞き取りの部分では音声認識の技術が使われます。回答するときは、音声合成技術を使い、まるで人間が話しているかのように振る舞いたいものです。

自然言語を理解する技術も音声認識や音声合成技術も、かなりレベルの高い技術力が必要です。しかしそんな高い技術力も最近のスマホにはどんどん取り入れられています。パソコンではなく、スマホの方が開発に力が入っているようです。スマホと言えば、iPhoneのSiri。音声認識や音声合成技術など最先端の技術を駆使したサービスを受けられます。他にも、AndroidのOK Googleもこの分野で秀でています。

ちなみに、マイクロソフトはCortana、NTTドコモは「しゃべっとコンシェル」といったサービスを使い新しい技術革新を目指しています。

能力の限界とこれから

SiriやOKGoogleの音声認識技術はまだまだこれからと言われています。OK Googleだけでは簡単な日本語しか使えません。文法を複雑にすると伝わらないので、とても簡単な文法で話す必要があります。ここまでコンピューターにあわせてあげなければいけない技術は、まだ実用化できるレベルではないと言えるでしょう。

音声認識技術をクリアするのと同時に、日本語の複雑な文法構造も理解しなければなりません。主語があるのか無いのかあいまいな日本語は、コンピューターが理解するには少し難しそうです。

これからのAI技術

音声認識技術を飛躍的に高める方法の1つにディープラーニングという方法があります。AIがいろいろな音声を聞き続けるなかで、自発的に音声認識技術を高めることが可能になります。

また、音声認識技術を開発する一方、AIのエージェント機能にも注目が集まります。エージェント機能とは、けっしてメイン機能ではないけど、あると便利な機能です。例えば、朝6時に起きなければ行けないことをスケジュール管理表から把握したら、その時間にアラームを鳴らす機能などが考えられています。

AIはビッグデータと紐づくことで社会をますます変えていくことが期待されています。なぜなら、ビッグデータは存在しても、そのデータを上手に活用できているか疑問があるからです。ビッグデータにAIを掛け合わせるだけで、日本の医療制度に風穴を開けることができるかもしれません。