モバイル通信事業等を手掛けるEmpathは、5月8日、NTTドコモと共同で雑音環境での音声感情認識技術を開発し、2018年度中にNTTドコモ(以下、ドコモ)が提供する自動車向けの音声エージェントサービス「AIインフォテイメントサービス」に導入することを目指すと発表した。
今回発表された技術は、NTTグループが開発したAI「corevo」を構成するドコモ独自の音声感情認識技術とEmpathが持つ音声感情解析AIである「Empath」の技術を基に開発したもの。
この技術を活用することで、2社は自動車とドライバーを感情によって結びつけ、ドライバーが自動車に愛着をもって楽しく運転したり、運転に集中して居眠り運転の解消などに貢献すると考えている。
実際に2社は、2017年11月から2018年3月までの間、走行雑音がある環境で音声による感情推定の認識率向上の取り組みを実施。
その結果、停車中のような雑音が小さい条件から高速道走行中のように大きな走行雑音がある条件において、自然に発声された対話音声の「怒り」、「喜び」、「悲しみ」の感情の認識を従来の技術では60%程度(ドコモ調べ)だったところ、この技術では業界で最高水準の高い平均正答率となる75%で実現している。
また、AIが被験者の感情を理解して感情にあわせた声かけを行うことで、ドライバーの眠気やだるさなどの倦怠感を表す指標値が50%減少し、被験者の93%はAIが自分の気持ちに寄り添ってくれていると感じ、気分良く運転できることを実証実験にて確認している。
なお、この技術を活用し2社が実用を目指すAIインフォテイメントサービスのコンセプトのデモが、2018年5月9日(水)から2018年5月11日(金)まで東京ビッグサイトで開催中の
「2018 JAPAN IT Week」内の「IoT/M2M展」
のドコモブースで、デモを実施している。