日立製作所(日立)は2月19日、ドローンやヘリコプターによる空撮映像から、災害状況を高精度に解析できるAI技術を開発したと発表した。
このAI技術により、災害発生時、人がすぐにはたどり着けない現場の状況を、迅速かつ容易に、詳しく把握することが可能となる。また、同技術はアメリカ国立標準技術研究所*1 が主催する映像解析のワークショップ TRECVID (TREC Video Retrieval Evaluation) 2020で、災害映像解析のタスクであるDSDI(Disaster Scene Description and Indexing)*2 においてトップレベルの認識精度を達成した。同社では、今後、同技術を活用した災害時の対策を支援する社会イノベーションを推進し、自治体や設備保守、保険会社などのパートナーとの協創を通じて、レジリエントな社会、人々の安全、安心な暮らしの実現に貢献するとしている。
日本をはじめとした多くの国や地域で、気象変動がもたらす洪水や土砂崩れなど、自然災害による人命や財産の被害拡大が社会問題となっており、災害発生時には、迅速な状況把握や、避難経路の誘導など、被害を減らす対策が求められている。世界的な要望に応えるため、空撮のための無人航空機(UAV)の導入が進められ、AIを活用した映像の自動解析が注目を集めている。しかし、空撮映像から災害状況を解析する場合、災害によっては学習データ数が少なく認識精度に影響が出るという課題がある。また、広範囲を撮影した映像では、特定したいものが非常に小さく映っていたり、さまざまなものや災害状況が同時に映っていたり(例えば「浸水家屋」「橋梁倒壊」「地滑り」が一つの画像に存在するなど)することがあり、そのような場合には起きている状況を正しく認識することが困難だった。
日立では、防犯や製造現場向けの映像解析技術で培ってきた知見を活かし、自然災害映像も高精度に認識できる災害映像解析技術を開発した。今回開発された技術の長所については 以下の4点が挙げられる。
1)映像内に映るものが複数でも、それらのものを同時に精度良く認識する事ができる
[画像]「侵水家屋」発見(水、家屋といった複数のものを認識)
2)広範囲を撮影した映像の中から、人が見つけにくい小さなものを見つける事ができる
[画像]「車」発見(人が見つけにくい小さなもの)
3)学習サンプル数が少なくてAIに教えることが通常は困難な災害状況に対しても、精度良く認識する事ができる
[画像]「地滑り」発見(サンプル数が少ない災害状況)
4)見逃し・誤分類などの誤った情報を多く含む学習サンプルに対応したAI学習手法によって、人でも判断が難しい災害状況の誤認識や見逃しを減らす事ができる
[画像]「橋梁倒壊」発見(人でも判断が難しい災害状況)
なお、日立は大学共同利用機関法人情報・システム研究機構国立情報学研究所、国立研究開発法人情報通信研究機構と産学官連携で共に、映像解析の国際的なワークショップである TRECVID 2020のDSDIに参加し、本技術を用いて、全17チーム参加の中、外部データを使用しないチームにおいてトップレベルの認識精度を達成した。DSDIでは、大量のテストデータが、浸水家屋、橋梁倒壊、地滑り、瓦礫の山といったどの災害状況やものに当てはまるかの度合いをランキング付けして予測し、予測したランキングと正解のランキングとの比較で、AIの認識精度が評価される。同ワークショップは、映像の意味理解と検索の技術向上を目的に2001年から開催されている。現在さまざまなAI技術に関連するコンペがある中でも、歴史のある高い権威を持つワークショップの一つで、世界各国から著名な企業や大学が参加している。
*1 アメリカ国立標準技術研究所 (National Institute of Standards and Technology)
*2 DSDI task