AIで、周囲の“音”から起きている状況を認識する「音状況認識技術」、NECが開発

2016年11月29日@it

 
 NECは2016年11月28日、AI(Artificial Intelligence:人工知能)技術を用い、周辺環境の音を解析して今起きている状況を認識する「音状況認識技術」を開発したと発表した。

 障害物や人垣の向こう側のように、カメラでは見通せない状況でも、対象から発せられる音を解析して状況を識別する。同社の先端AI技術群「NEC the WISE」を構成する1技術として展開し、公共施設や観光地での犯罪/事故の検知や、高齢者宅での見守りなど、社会システムへの幅広い適用が想定される。

 音状況認識技術は、マイクで収集した音を目的音と環境雑音に分けた上で、目的音を構成する成分(構成音)を抽出する「構成音抽出技術」と、構成音の組み合わせパターンから目的とする事象の有無を判別する「事象判別技術」を組み合わせて実現する。

 構成する技術のうち、構成音抽出技術は、環境の違いに影響しない構成音を機械学習させ、学習させていない未知の音の成分を環境雑音と定義する。例えばガラスが割れる際の音は、「ガシャン」「バリン」「パリン」などが考えられる。この場合は「ガ」や「シャ」、「バ」や「パ」などが構成音に相当し、これらの音をデータ化している。

 もう1つの事象判別技術では、前述したガラスの割れる音ならば、「ガ」や「シャ」、「バ」や「パ」などの組み合わせを事象パターンとして機械学習させる。これらのパターンと、構成音抽出技術で抽出した構成音を照合して、目的の事象の有無を判別する仕組みだという。

 同社の検証では、AIによる音状況認識技術により、従来比で5倍遠い距離から発せられた小さな音でも実用レベルで検知できるようになったとしている。AIによって目的音を環境ごとに自動学習するので、未知の環境にも比較的容易に導入が可能という。

 例えば犯罪/事故を検知したいシーンでは、ガラスの割れる音や悲鳴、罵声などの検知をトリガーに、「ちょっとしたいさかい」なのか「より重大な事件」なのかを自動的に識別し、その次の対処へつなげられる。高齢者の見守りシーンでは、遠くの水道の蛇口から水が流れる音、電動歯ブラシの音、ドライヤーの音などを検知できれば、「洗面中である」と識別できる。
 音ならば、見通せない場所の情報を収集可能だ。しかし周囲には、識別の対象とするモノや人が発した音だけでなく、それ以外の環境雑音も含まれる。対象音の大きさが環境雑音よりも常に大きいとは限らず、測定する環境や、目的とする対象によっても異なる。例えば、深夜に「キャー」といった悲鳴や、「バリン」といったガラスの割れた音がすれば、人は「何かがあった」と推測/判断し、「そのためにこうする」と行動できる。

 それを、人力以上の精度で自動識別できるようにすることで、IoTシステムのさらなる高度化/自動化や社会システムへの貢献につなぐのが狙いだ。