LINEヤフーが提供する基本無料で利用可能なカーナビアプリ「Yahoo!カーナビ」(iOS版、Android版)は7月16日、「LINEヤフーの高品質なオンデバイス音声生成AI」を初めて搭載した音声案内(の提供を開始した。利用は、アプリを最新版にアップデートすれば、すぐに利用できるという。
今回のアップデートは、オンデバイス型ニューラル音声合成技術により、従来よりも高品質な音声を生成。声の抑揚や感情、発音の細かなニュアンスまで緻密に再現させた。
音声サンプル: https://www.instagram.com/reel/C9PHQzwJ0cs/
これにより、声の質と音量が改善され、より明瞭で聞き取りやすい音声の提供が可能になった。また、インターネットに接続することなく、スマートフォンやタブレットなどのモバイルデバイス上で低遅延で動作するため、従来通り山奥やトンネル内など電波が届きにくい環境でもスムーズにルート案内が可能としている。
LINEヤフーでは、「Yahoo!カーナビは、ユーザーが快適なカーライフを実現するために、ユーザーの声を積極的に反映しながら機能拡充や改善、ディスプレイオーディオや雨雲レーダーなどの機能の提供を行っています。
今回、より快適で安全なドライブを行って欲しいという思いから、音声案内の発話品質を向上した本機能の提供を開始しました。当社は、引き続き、利便性と安全性を、これまで以上にサポートいたします」と説明している。
新バージョンによる搭載機能の特徴は以下の通り
– 自然な発話: ニューラル音声合成技術を使用することで、より人の発話に近い音声を提供。
– これにより、音声を聞き取りにくいユーザーにも聞き取りやすく、聞き間違えなどによる判断・認識のしづらさ、使いづらさを軽減させた。
今回、新たな技術開発に携わった担当者は、「本技術は、2023年10月にLINEヤフー株式会社が発足してから、わずか約半年という短期間で提供を開始しました。
旧ヤフー株式会社は音声認識のiOS/Android上のオンデバイス推論技術を、旧LINE株式会社は、CPU上で軽量動作する高品質なニューラル音声合成技術を保有しており、それぞれの技術を統合することで本技術は誕生しました。
本技術の音声合成のコア技術に関する研究成果は、音声・音響信号処理における世界最大の国際学会 「ICASSP 2023」にて論文が採択されています。
今後も本技術の高品質化・高速化を継続的に行い、複数話者選択、感情制御、プロンプトによる声質制御などの機能も含めてユーザーの課題解決にむけて柔軟にユーザーニーズに対応していきます。今後の展開にもご期待ください」と述べた。
Apple CarPlay: https://carnavi.yahoo.co.jp/promo/carplay/
Android Auto: https://carnavi.yahoo.co.jp/promo/android_auto/