AIが赤ちゃんの泣き声を聞き分ける

ノーザン・イリノイ・ユニバーシティの電気工学科のAIが赤ちゃんの泣き声の意味を聞き分けられるようになったそうです。
ただし現状では正常な泣き声と異常な泣き声の違いがわかる程度。

AIは線形予測符号化(LPC)、線形予測ケプストラム係数(LPCC)、バーク周波数ケプストラム係数(BFCC)、およびメル周波数ケプストラム係数(MFCC)を使って学習しているとのこと。
線形予測符号化とは音声解析で使われる基本的な技術らしいです。
人の発話を長い管の先端で出ている音とみなして、音の大きさと周波数でモデル化したとのこと。

また圧縮センシング技術を使い、背景ノイズから泣き声を抽出しているそうです。
圧縮センシングとは、少ないデータから元のデータを復元する技術のこと。
ノイズで断片化した泣き声から元の泣き声を復元している訳です。

Infant cry language analysis and recognition: an experimental approach

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください