Thought Leadership

Kristopher Ardis
Kris Ardis,

Managing Director

著者について
Kris Ardis
Kris Ardisは、アナログ・デバイセズのデジタル・ビジネス・ユニットのマネージング・ディレクタです。1997年にソフトウェア・エンジニアとしてアナログ・デバイセズにおけるキャリアをスタートさせ、米国特許を2件保有しています。現在はプロセッサを担当しています。テキサス大学オースティン校でコンピュータ・サイエンスの学士号を取得しました。
詳細を閉じる

エッジAIの夢


The Dream of Edge AI

現在では空飛ぶ自動車が実用化されようとしています。ロボット執事も同様です。運が悪ければ、人間が終末を迎える前に、感情を持つようになったロボットが人類に対し反乱を起こすことがあるかもしれません。現在はそのような事態には至っていませんが、人工知能(AI)技術がそのような可能性を開いたと言えることは明らかです。あなたがアレクサに何かを尋ねるたびに、機械学習技術があなたの言ったことを理解し、何を望んでいるのかをできるだけ正確に判断しようとします。ネットフリックスやアマゾンによる次の映画や商品の推薦は高度な機械学習アルゴリズムに基づくもので、その内容には説得力があり、これまでのセールス・プロモーションよりはるかに魅力的なものです。私たちすべてが自動運転車を持つことはないかもしれませんが、その分野における発展と自律型ナビゲーションが提供し得る可能性については、すべての人が強く意識しています。

AI技術は人々に大きな期待を抱かせます。機械が人間と同じように(あるいは人間よりも優れた形で)周囲の状況に基づいて自ら判断を下し、情報を処理できるという期待です。しかし、上記のような例を考えた場合、人々がAIに期待するものを実現できるのは大型の装置に限られてきます。つまり、消費電力、サイズ、あるいはコストの制約を受けない装置です。言い換えると、これらの装置は大量の熱を発し、ライン電源を使用し、大型で、しかも高価なものになるということです。アレクサやネットフリックスがあなたの意図を理解するには、クラウド上に置かれた大型で消費電力の大きいサーバが必要です。自動運転車も同様にバッテリに依存していますが、車輪を駆動したりステアリングを行ったりしなければならないことを考慮すると、そのエネルギー容量は巨大なもので、最もエネルギーを必要とするAI判断よりも大量のエネルギーを消費します。

AIに寄せられる期待は大きいものですが、小型の装置は置き去りになっています。小型のバッテリを使用するデバイス、あるいはコストやサイズが制約されるデバイスは、機械が見聞きするという考え方に加わることができません。現在のところ、これらの小型装置が使用できるAI技術は、1つのキーワードを聞き分けたり、心拍からフォトプレチスモグラフィ(PPG)などで得られる低次元信号を分析したりといった、簡単なものに限られています。

見聞きする能力を備えた小型装置が開く可能性

しかし、小型の装置に情報を見聞きする能力を持たせる価値があるのでしょうか。ドアベル・カメラのような装置に自動運転や自然言語処理のような技術を利用することを考えるのは難しいですが、語彙認識、音声認識、画像分析など、あまり複雑でなく、処理負荷の小さいAI処理を利用する機会はあります。

  • ドアベル・カメラやコンスーマ用セキュリティ・カメラが、風による植物の動き、雲による大きな光の変化、あるいは犬や猫の動きなど、本来の対象ではないイベントによって作動することは珍しくありません。このような誤作動が多いと、せっかくカメラを設定してもアラームを無視しがちになるでしょう。更に、家主が海外旅行などをした場合は、日の出、雲、日没などの光の変化によって、家主が眠っている間にカメラがアラームを発する可能性もあります。より高度なスマート機能を備えたカメラは、基準フレーム内に人間が現れた場合など、より限定的なイベントによって作動させることができます。
  • ドア・ロックその他のアクセス・ポイントは、顔認識や音声認識を使用して登録者だけにアクセスを許可し、場合によっては鍵やバッジを不要にします。
  • 多くのカメラは、特定のイベントに基づいて作動するのが望ましい形です。例えば、トレイル・カメラはフレーム内に鹿などが現れたときに作動し、セキュリティ・カメラはフレーム内に人が現れたときやドアの開く音や足音がしたときに作動し、パーソナル・カメラは音声コマンドで作動するといった具合です。
  • 多くのアプリケーションでは大量の音声コマンドが役に立つ場合が多いと思いますが、20語前後の語彙から開始する場合は「ヘイ、アレクサ」のようなソリューションも数多くあり、これは産業機器、ホーム・オートメーション、調理器具、その他様々なデバイスに使用して、人間とのやり取りを容易にすることができます。

これらの例はほんの一部に過ぎず、これまでは人間が介在する必要のあった状況で、小型装置が情報を見聞きして問題を解決できるようにするという発想は非常に有効なものであり、新しいユースケースは今後も毎日のように見つかるでしょう。

小型装置にAI機能を持たせる際の課題

では、小型装置にとってAIがそれほど価値のあるものならば、なぜまだ実現されていないのでしょうか。その答えは計算処理能力にあります。AIによる推論は、ニューラル・ネットワーク・モデルの計算結果です。ニューラル・ネットワーク・モデルを、人間の脳が画像や音響を処理する方法とほぼ同じ処理をするものと考えてみましょう。情報を非常に細かい断片に分解し、それらの断片をまとめてパターンを認識します。現代のビジョン問題のワークホース・モデルが畳み込みニューラル・ネットワーク(CNN)です。この種のモデルは画像分析に非常に適しており、オーディオ分析にも極めて有効です。課題になるのは、これらのモデルが数百万回、あるいは数十億回におよぶ数学的計算を行うという点です。従来から、これらのアプリケーションを実装するにあたっては難しい選択が求められています。

  • 低コストで低消費電力のマイクロコントローラ・ソリューションを使用する。CNNは、一般に平均消費電力が低い一方で、計算に数秒間を要することもあります。これは、AIによる推論がリアルタイムではないこと、そしてかなりのバッテリ電力を消費することを意味します。
  • 求められるレイテンシで数学的演算を完了することのできる、高価で消費電力の大きいプロセッサを購入する。普通、これらのプロセッサは大きく、ヒート・シンクやその他同様の冷却コンポーネントを含め、多くの外部コンポーネントを必要とします。しかし、AIによる推論は非常に速いスピードで実行されます。
  • 実装しない。低消費電力のマイクロコントローラ・ソリューションは低速すぎて実用に適さず、高消費電力のプロセッサを使用すると、コスト、サイズ、消費電力面での要求を満たすことができません。

必要なのは、CNN計算の消費電力を最小限に抑えるために、新たな組込みAIソリューションを作成することです。AIによる推論では、従来のマイクロコントローラ・ソリューションやプロセッサ・ソリューションより少ない消費電力で、なおかつ電力、サイズ、コストを必要とするメモリなどの外部コンポーネントの助けを借りることなく、桁違いに多い回数の計算を行う必要があります。AI推論ソリューションがマシン・ビジョンの消費電力に関わる問題を実質的に解決できれば、非常にサイズの小さいデバイスでも周囲の状況を観察し、認識できるようになります。

幸いなのは、このような動き、つまり小型装置の革命が始まったばかりだということです。AI推論のエネルギー・コストの問題をほぼ解決し、バッテリ駆動のマシン・ビジョンを可能にした製品も入手できるようになりました。わずか数マイクロジュールのエネルギーでAI推論を実行できるように作られたマイクロコントローラ、MAX78000の詳細をご覧ください。