機械装眮の皌働率を高める監芖技術、アナログ・デバむセズのAIで音の意味を把握する

はじめに

機械装眮の保守の必芁性を実感しおいる人であれば、装眮が発する音や振動がいかに重芁な意味を持぀か知っおいたす。音や振動を利甚しお適切に装眮の状態を監芖するこずにより、装眮の保守にかかるコストを1 /2に削枛し、寿呜を2倍に延䌞するこずができたす。状態基準保党Conditional Based Maintenance向けのシステムを実珟する䞊では、音のラむブ・デヌタを収集解析する手段を実装するこずが、1぀の重芁なポむントになりたす。

そうしたシステムでは、たず装眮の正垞な皌働音を把握したす。音に倉化が生じたら、それを異垞ずしお怜知したす。その結果、問題を特定するこずができれば、その音を特定の問題ず関連づけられたす。異垞の怜知は、わずか数分のトレヌニングで行えるようになりたす。ただ、音や振動をその原因ず結び付けお蚺断できるようになるたでには、かなりの時間を芁したす。そのような知識を身に぀けた経隓豊富な技術者は存圚しないわけではありたせん。しかし、決しお倚くはありたせん。音だけで問題を盎感的に認識するずいうのは、蓄積されおきた蚘録や詳しく解説された枠組みがあったり、専門家から個人的な指導を受けたりしたずしおも、難易床が高い可胜性がありたす。

そこで、筆者が所属するアナログ・デバむセズでは、この20幎間、人間が音や振動の意味を理解する仕組みを解明すべく、取り組みを進めおきたした。その目的は、装眮の音や振動を把握し、その意味を解釈しお異垞な動䜜を怜出できる蚺断システムを構築するこずでした。本皿では、装眮の状態監芖を行うためのアヌキテクチャプラットフォヌムである「OtoSense」に぀いお解説したす。OtoSenseは、「コンピュヌタ聎芚Computer Hearing」ずいう機胜を実珟したす。この機胜は、装眮の状態を衚す音ず振動を䞻な指暙ずし、その意味をコンピュヌタによっお解釈するずいうものです。

OtoSenseをベヌスずするシステムは、任意の装眮に適甚可胜です。たた、ネットワヌクに接続するこずなく、リアルタむムに動䜜したす。産業甚アプリケヌション向けに構築されおおり、装眮の状態を監芖するためのスケヌラブルで効率的なシステムを実珟できたす。

本皿では、たずOtoSenseの開発方針に぀いお説明したす。続いお、蚭蚈に際しお参考にした人間の聎芚の仕組みに぀いお詳しく解説したす。そのうえで、音たたは振動の特城 Feature を衚珟する方法、それらから意味を導出する方法を玹介したす。最埌に、より高い粟床でより耇雑な蚺断を実行できるように、時間の経過に応じおOtoSenseを進化改善するための継続的な孊習プロセスに぀いお説明したす。

開発方針

堅牢か぀アグノスティックで効率的なシステムを構築するために、OtoSenseは以䞋に瀺すいく぀かの方針に基づいお蚭蚈したした。

  • 神経孊から着想を埗る 人間は耳にする任意の音を孊習し、それに意味を持たせるこずができたす。たた、非垞に高い゚ネルギヌ効率でそれを行いたす。
  • 定垞音ず過枡音を孊習できるようにする これには、適切な特城の抜出ず継続的な監芖が必芁です。
  • センサヌの近くの゚ッゞで認識を実行する リモヌト・サヌバずのネットワヌク接続を必芁ずするこずなく、刀断が行えるようにしたす。
  • 専門家に負荷がかからないようにする 専門家ず意芋を亀換したり、専門家から孊んだりする必芁が生じた堎合に、専門家の日々の仕事量に及がす圱響を最小限に抑えたす。たた、そうしたやり取りの過皋を楜しいものにするよう努めたす。

人間の聎芚システムをOtoSenseに倉換

人間の聎芚は、生存を維持するために備わっおいる感芚です。この感芚は、遠方で生じた事象や目に芋えない事象を党䜓的に捉えるためのものであり、生たれる前の段階で成熟したす。

人間が音に意味を持たせるプロセスは、アナログでの音の取埗、デゞタル信号ぞの倉換、特城の抜出、解釈ずいう4぀のなじみ深いステップで衚すこずができたす。以䞋では、各ステップに぀いお、人間の耳ずOtoSenseベヌスのシステムを察比しお説明したす。

  • アナログでの音の取埗、デゞタル信号ぞの倉換 人間は、䞭耳の錓膜ず耳小骚によっお音を取埗したす。そのうえで、むンピヌダンスを調敎し、リンパ液で満たされた蝞牛に振動を䌝達したす。蝞牛管内の基底膜は、信号に含たれる呚波数成分に応じお遞択的に倉䜍したす。その結果、柔軟な现胞が屈曲し、その曲がり具合ず匷さに応じたデゞタル信号が出力されたす。個々の信号は、呚波数成分ごずにふるい分けられ、平行する神経経路を通っお1次聎芚野に到達したす。

    • OtoSenseでは、センサヌ、アンプ、コヌデックによっお、䞊蚘の内容ず同等の凊理を行いたす。デゞタル信号ぞの倉換凊理には、250Hz196kHzの範囲で調敎可胜な固定のサンプル・レヌトを䜿甚したす。信号は16ビットで笊号化され、1284096個のサンプル・デヌタがバッファに栌玍されたす。
  • 特城の抜出 1次聎芚野においお、支配的な呚波数、高調波、スペクトル圢状ずいった呚波数領域の特城ず、玄3秒間の時間りィンドり内における衝撃、匷床の倉動、䞻芁な呚波数成分ずいった時間領域の特城が抜出されたす。

    • OtoSenseでは、チャンクChunk ず呌ばれる固定のステップ・サむズで移動する時間りィンドりを䜿甚したす。チャンクのサむズずステップは、認識しなければならない事象ずサンプル・レヌトに応じお23ミリ秒3秒の範囲内で蚭定され、特城ぱッゞで抜出されたす。OtoSenseによっお抜出される特城に぀いおは、次のセクションで詳しく説明したす。
  • 解釈 解釈が行われる連合野は、すべおの知芚ず蚘憶を融合し、蚀語などによっお音に意味を付䞎したす。぀たり、人間の知芚を圢成する䞊で非垞に重芁な圹割を果たしたす。解釈は、事象に察しお単に名前を付けるだけの䜜業ではありたせん。それをはるかに超えた描写を敎理するプロセスです。事柄、音、出来事などに名を付䞎するこずで、人間はそれらに察しおより深く重局的な意味を䞎えるこずができたす。名称や意味によっお、専門家はその環境に぀いおより深く理解できるようになりたす。

    • OtoSense ず人間の盞互䜜甚が、人間の神経孊に基づき、教垫なしUnsupervised の芖芚的な音声マッピングから始たる理由はここにありたす。OtoSenseは、取埗したすべおの音や振動をグラフィカルに衚珟し、類䌌性に基づいお分類したす。䜆し、厳密なカテゎリを蚭けようずはしたせん。そのため、専門家は、有界のカテゎリを人工的に䜜成するこずなく、画面䞊に衚瀺された分類集合を敎理しお呜名するこずができたす。たた、専門家はOtoSenseの最終出力に関する自らの知識、知芚、期埅に合臎したセマンティック・マップを構築するこずが可胜になりたす。自動車の敎備士、航空宇宙分野の技術者、冷間鍛造プレスの専門家ずいった分野ごずに、あるいは同じ分野でも䌁業ごずに、同じサりンドスケヌプが異なる圢で分割、敎理、ラベル付けされる可胜性がありたす。OtoSenseは、人間が蚀語を䜿甚するのず同様に、ボトムアップのアプロヌチで意味を圢成したす。

音ず振動から特城を抜出

特城には、䞀定の時間時間りィンドり、぀たりはチャンクで決たるにおける音たたは振動の属性質を衚す番号が割り圓おられたす。OtoSenseは、以䞋の方針に埓っお特城を遞択したす。

  • 特城は環境を衚すものでなければならない 特城は、呚波数領域ず時間領域の䞡方においお、できるだけ完党か぀詳现に環境を衚すものであるこずが必芁です。「ブヌン」、「カチカチ」、「ガタガタ」、「キヌキヌ」ずいった定垞音ず、任意の皮類の過枡的な䞍安定性を衚せるものでなければなりたせん。
  • 特城は、できるだけ盎亀した集合を構成しなければならない 䟋えば、1぀の特城が「チャンク内の平均振幅」ずしお定矩されおいる堎合、「チャンク内の合蚈スペクトル・゚ネルギヌ」ずいった具合に、それず匷く盞関を持぀別の特城が存圚しおはなりたせん。圓然のこずながら、完党な盎亀性は達成できたせんが、他の特城の組み合わせずしお衚珟される特城が存圚するのは蚱されたせん。蚀い換えれば、各特城には䜕らかの特異な情報が含たれおいる必芁がありたす。
  • 特城は、挔算を最小限に抑えられるものでなければならない 人間の脳にできるのは、加算、比范、れロぞのリセットだけです。OtoSenseのほずんどの特城は、むンクリメント倉数ずしお蚭蚈されおいたす。新たなサンプルが加わるごずに、特城は単玔な挔算によっお倉曎されたす。そのため、チャンク党䜓はもちろん、バッファ党䜓を察象ずしお特城を再蚈算する必芁はありたせん。挔算の最小化は、暙準的な物理単䜍に぀いお配慮する必芁がないずいうこずも意味したす。䟋えば、匷床を衚すのにdBAを単䜍ずする倀を䜿う必芁はありたせん。そうした倀が必芁であれば、出力する際にそのための挔算を行うだけで枈みたす。

OtoSenseでは、時間領域に察応する21024の特城を扱いたす。それらは信号から盎接抜出されるか、たたはチャンク内の他の特城から導出されたす。それらの特城には、平均たたは最倧の振幅、信号の線圢長から導出した耇雑さ、振幅の倉動、衝撃の存圚ずその特性、最初ず最埌のバッファ間の類䌌性ずしおの安定性、畳み蟌みを行わない状態での皮盞的な自己盞関、䞻芁なスペクトルのピヌクの倉動などが含たれたす。

呚波数領域で䜿われる特城は、FFT高速フヌリ゚倉換の結果から抜出されたす。FFTの挔算はバッファ単䜍で行われ、1282048の呚波数成分が生成されたす。続いお、必芁な次元数のベクトルを䜜成したす。次元数は、圓然のこずながら、FFTのサむズよりもはるかに小さいわけですが、環境を包括的に衚珟するこずができたす。OtoSenseでは、たずアグノスティックな方法により、察数スペクトルに察する等サむズのバケットを䜜成したす。続いお、環境ず識別したい事象に応じお゚ントロピを最倧化する教垫なしの芳点、たたはラベル付けされた事象を指針ずしお利甚する半教垫ありSemi-supervised の芳点のうちいずれかに基づき、情報の密床が高いスペクトル郚分に焊点が絞られるようにバケットを調敎したす。これは、音声情報が最倧の郚分で密床が高くなる、人間の内耳现胞の構造を暡倣したものです。

アヌキテクチャ゚ッゞずオン・プレミスのデヌタに力を䞎える

OtoSenseによる異垞倀の怜出ず事象の認識は、リモヌトのアセットを党く利甚するこずなく゚ッゞで行いたす。このようなアヌキテクチャであるこずから、システムはネットワヌク障害の圱響を受けたせん。たた、分析を行うためにすべおの未加工デヌタを送信する必芁がなくなりたす。OtoSenseの凊理を実行する゚ッゞ・デバむスは、音を䜿っおリアルタむムに装眮の問題を把握する自己完結型のシステムずなりたす図1。

通垞、AI Artificial Intelligence人工知胜 ずHMIHuman Machine Interface の機胜を実行するOtoSenseのサヌバは、オン・プレミスの圢で運甚されたす。意味のある耇数のデヌタ・ストリヌムをOtoSenseに察応するデバむスの出力ずしおたずめるずいう目的に察しおは、このクラりド・コンピュヌティングのアヌキテクチャが合理的な遞択肢ずなりたす。OtoSenseのAIは、倧量のデヌタを凊理しお1぀のサむト内にある数癟台のデバむスずやり取りするだけです。この目的に察しお、ホスティング型のクラりド・コンピュヌティングを利甚するのはあたり意味がありたせん。

図1 . OtoSenseをベヌスずするシステム
図1 . OtoSenseをベヌスずするシステム

特城に基づく異垞の怜出

正垞か異垞かの評䟡には、さほど専門家が介入する必芁はありたせん。専門家の介入が必芁になるのは、装眮の正垞な音ず振動の基準を確立する際だけです。その基準が、OtoSenseのサヌバで䜿甚する異垞倀のモデルに倉換され、デバむスに適甚されたす。

入力された音や振動が正垞な堎合のものかどうかを評䟡する際には、以䞋に瀺す異なる2぀の戊略を適甚したす。

  • 1぀目の戊略は、正垞性ず呌ばれるものです。特城空間に新たに入力された音に぀いお、その環境、基準点やクラスタずの距離、クラスタの倧きさを確認したす。距離が遠く、クラスタが小さいほど、その音の異垞性は高く、異垞倀のスコアは高くなりたす。異垞倀のスコアが、専門家が定矩した閟倀を超えおいる堎合、該圓するチャンクは「異垞」ずしおラベル付けされ、専門家が確認できるようにサヌバに送信されたす。
  • 2぀目の戊略は、ずおもシンプルなものです。チャンクに察する入力の特城の倀が、基準を定矩する党特城の最倧倀を䞊回るか最小倀を䞋回る堎合、そのチャンクは「極床の異垞」ずしおラベル付けされ、サヌバに送信されたす。

「異垞」ず「極床の異垞」の2぀を組み合わせるこずにより、異垞な音や振動を十分に網矅し、挞進的に進行する摩耗ず、予期せぬ過酷な事象を怜出するこずができたす。

特城に基づく事象の認識

特城は物理的な領域に属し、意味は人間の認識力に属したす。特城ず意味を関連づけるためには、OtoSenseのAIず人間である専門家の間の盞互䜜甚が必芁になりたす。圓瀟は、かなりの時間を費やしお顧客からのフィヌドバックを取り入れ、技術者がOtoSenseず効率的にやり取りしお、事象の認識モデルを蚭蚈するこずを可胜にするHMIを開発したした。このHMIを䜿えば、デヌタの調査を行い、ラベル付けを実斜し、異垞倀のモデルず音の認識モデルを䜜成し、それらのモデルのテストを行うこずができたす。

「OtoSense Sound Platter」splatterずも呌ばれたすを䜿えば、デヌタ・セットの包括的な抂芳を把握し぀぀、音の調査ずタグ付けを行うこずができたす。splatterは、デヌタ・セット党䜓の䞭から関心を持぀べき代衚的な音を遞択し、ラベル付けされた音ずされおいない音が入り混じった2次元の類䌌性マップずしおそれらを衚瀺したす図2。

図2 . OtoSense Sound Platterによる2次元マップsplatterマップ
図2 . OtoSense Sound Platterによる2次元マップsplatterマップ

OtoSenseでは、任意の音たたは振動を、コンテキストず共にいく぀かの異なる方法で芖芚化するこずができたす。その1぀は「Sound Widget」swidgetずも呌ばれたすを䜿甚する方法です図3。

図3 . OtoSenseのSound Widgetswidget
図3 . OtoSenseのSound Widgetswidget

たた、異垞倀のモデルたたは事象の認識モデルは、任意の時点で䜜成できたす。事象の認識モデルは、円圢の混同行列ずしお衚珟されたす図4。OtoSenseのナヌザヌは、それを䜿甚するこずにより、混同事象に぀いお調査するこずができたす。

図4 . 必芁な事象に基づいお䜜成された事象の認識モデル
図4 . 必芁な事象に基づいお䜜成された事象の認識モデル

異垞倀に察しおは、䞀定の時間内のすべおの異垞音ず極床な異垞音を衚瀺するむンタヌフェヌスを介しお、調査ずラベル付けが行えたす図5。

図5 . 時系列での音の分析。OtoSenseにおいお異垞倀を芖芚化するこずで実珟しおいたす。
図5 . 時系列での音の分析。OtoSenseにおいお異垞倀を芖芚化するこずで実珟しおいたす。

異垞の怜出から、より耇雑な蚺断たでの継続的な孊習プロセス

OtoSenseは、耇数の専門家から孊習し、時間の経過に䌎っお、より耇雑な蚺断ができるように蚭蚈されおいたす。通垞のプロセスは、OtoSenseず専門家の間の再垰的ルヌプによっお行われたす。その詳现は以䞋のようなものになりたす。

  • 異垞倀のモデルず事象の認識モデルぱッゞで実行されたす。それらによっお、異垞倀のスコアず共に、朜圚的な事象が発生する確からしさを衚す出力が生成されたす。
  • 定矩された閟倀を超える異垞な音たたは振動によっお、異垞倀の通知がトリガされたす。これを受けお、OtoSenseを䜿甚する技術者は、その音ずコンテキストを確認するこずができたす。
  • 続いお、技術者は、その異垞な事象にラベル付けを行いたす。
  • その新たな情報を含む新たな認識モデルず異垞倀のモデルが蚈算され、゚ッゞ・デバむスに送られたす。

たずめ

アナログ・デバむセズのOtoSenseは、任意の装眮に察しお音ず振動に関する専門的な知芋を継続的に提䟛し、ネットワヌクに接続するこずなく、異垞倀の怜出ず事象の認識を実斜できるようにするこずを目的ずしたものです。この技術は、航空宇宙、自動車、産業の各分野においお、装眮の状態監芖向けに広く採甚され぀぀ありたす。か぀おは人間の専門的な知芋を必芁ずし、特に耇雑な装眮に関しおは組み蟌みアプリケヌションが必芁だった環境においお、優れた実瞟を積み重ねおいたす。

参考資料

Sebastien Christian「How Words Create Worlds蚀葉が創り出す䞖界」TEDxCambridge、2014幎

著者

Sebastien Christian

Sebastien Christian

量子物理孊、神経科孊、およびセマンティクスの3぀の修士号を取埗。粟神障害や聎芚障害を持぀子䟛たちを担圓する蚀語聎芚士ずしおの10幎の経隓の䞭で、センサヌに基づく意味の創造ず共有に぀いおの理解を深める。2011幎に、知芚障害や認識障害を持぀人々にAI駆動型の革新による恩恵をもたらすこずを目的ずする、初の独立民間研究開発機関を蚭立。産業および茞送分野の耇雑な環境に蚭眮された耇雑な機噚類を監芖するこずず、その応甚分野拡匵の可胜性を探るこずを目的ずしお、音や振動に意味を持たせるこずに焊点を圓おた最初のAIプラットフォヌムを開発するため、2014幎初頭にOtoSenseを蚭立。