デンソーテンは9月28日、ドライブレコーダーなどの組込み機器(以下「エッジ端末」)で撮影した車両や歩行者などの物体を、エッジ端末のSoC上でリアルタイムに認識する軽量・高性能なエッジAI(人工知能)技術を開発したと発表した。
同社によると、このエッジAI技術は、処理能力0.5TOPS程度のSoCで、高性能コンピューターに用いられるGPU向けAIに匹敵する性能を実現。自社製品への搭載に加えて、SoC上で動作するAI学習済みモデル(ソフトウェア)の外販も行われる。
エッジAI技術の適用例:ドライブレコーダーなどの車載機器から効率的にデータを収集
エッジAI技術の適用先の一つに、車載機によるデータ収集が挙げられる。同社は2005年にタクシー向けドライブレコーダーを発売。2015年にはクラウドセンターと連携し、走行中の膨大な記録データの中から危険と判断された画像だけをリアルタイムに確認できる「クラウド連携ドライブレコーダー」を商品化した。
コネクティッドカーの普及に伴うデータ活用の多様化・高度化によって、例えば、ドライブレコーダーが収集する画像データに対する需要が増え、それをクラウドセンターに送信するための通信コストや、クラウドセンターのストレージコストなどデータ収集コストの増加が見込まれる。そこで、解決策として、まず、車の中にエッジAIを搭載して撮影した画像に映り込んでいる物体を認識し、(a)例えば、看板や車の台数などの認識結果を文字データとしてクラウドセンターに送信。次に、クラウドセンターで認識結果に基づいて(b)本当に必要な画像データの送信だけを車載機器へ要求することで、データ収集に係るコストを大幅に削減し、効率の良いデータ収集を行えるようになる。今回、このような車載用途に適用可能な、軽量・高性能なエッジAI技術を開発した。
演算量削減と高度な認識性能を両立、教師データ作成やAIモデル学習に係る時間も短縮
– 画像認識AI技術の概要
画像認識AI技術は、ディープラーニング(深層学習)が主流になっている。ディープラーニングの画像認識ソフトウェア(以下「AIモデル」)は、ニューラルネットワークと呼ばれる人間の脳の神経を模倣した構成を多層的に重ね合わせる。多層のニューラルネットワークであるため演算量は多いが、従来の認識技術よりも高精度に認識可能。この技術では、認識したい物体を含む画像(教師データ)を大量(数万~数十万枚)に用意してAIモデルに何度も学習させ、その結果をSoCに載せられるサイズに軽量化して実装する。
– 課題
AIモデルの構築・更新・変更には以下の課題を克服しなければならない。
1.小規模なSoCでの処理を可能とする、少ない演算量・メモリ量と、それらによってもたらされる、他のプロセスとも共存可能な軽量化(プロセス⑤)
2.大量の教師データを作成するための工数削減(プロセス③)と、AIモデル生成における工数削減(プロセス④)
– デンソーテンの開発技術の特長を生かした解決策
1.超軽量エッジAI技術
・様々な大学や研究機関、企業などで開発されている高性能の画像認識AIから、車載機向けのベースとなるAIを選定。性能確保のために残すべき部分を特定し、そうでない部分を簡単な演算に置き換えることでAIモデルの演算量・メモリ量を削減(プロセス⑤)
・高性能パソコン向けのGPUなどで実行される代表的なAIである、Darknet53+Yolov3と比較して、1/60以下の演算量と1/32以下のメモリ量で同等の認識性能を実現
2.モデル生成効率化技術
・今回開発した当社のエッジAI技術と組み合わせることで教師データの作成にかかる手作業を一部自動化。経験豊富な人の手作業による教師データ作成と比較して時間を20%削減(プロセス③)
・同社のAI技術者が保有するノウハウをソフトウェア化することで性能の良いモデルを作るための設定値(学習用パラメータ)を特定する工程を自動化。AI技術者がいなくてもAI技術者が作成したモデルと同等性能のモデルを短期間かつ自動で生成することが可能(プロセス④)
通行量把握や防犯、監視向けなど車載以外の用途も提案
これら技術開発で作成したAIモデルを自社製品に適用。さらに、収集画像の個人情報保護(例:映り込んでいる人の顔をマスク)、車両や歩行者による通行量の把握、防犯カメラでの侵入検知、店舗内カメラによる来店客の移動軌跡の検出など車載以外の用途も提案していく。