Yahoo!ニュース

IDでもっと便利に新規取得

ログイン

FPGAで“GPU級”のAIアクセラレーター実現を目指す

配信

EE Times Japan

 AI(人工知能)ソフトウェアを手掛ける新興企業Mipsologyは2020年6月24日(米国時間)、Xilinxのデータセンター向けアクセラレーターカード「Alveo U50」に、Zebraが統合されたと発表した。Xilinxとの協業により、コマンドを1つ追加するだけで、AIアクセラレーターアプリケーションのGPUをFPGAで置き換えられるという。Mipsologyの推論エンジン「Zebra」で、GPUコードを変換し、FPGA上で動作できるようにする。設計者がコードを変更したり再トレーニングを行ったりする必要はない。Zebraは既に、「Alveo U200」「Alveo U250」など他のアクセラレーターカードをサポートしている。 Zebraのソフトウェアスタック。FPGAカードと組み合わせて、データセンター、データセンターのエッジ、組み込み機器まで応用できる 出典:Mipsology(クリックで拡大)  Xilinxのマーケティング部門担当バイスプレジデントを務めるRamine Roane氏は、「Zebraは、当社のAlveoカード上で、CPU/GPUアクセラレーターをはるかにしのぐアクセラレーション性能を実現する。Alveo U50は、Zebraと組み合わせることにより、AIワークロードに必要とされる柔軟性と性能を達成し、あらゆる導入事例において高スループットや低レイテンシなどの優れた性能を実現することができる」と述べている。  FPGAはこれまで、専門家以外の人々にとって、プログラムが極めて難しいとされてきたが、Mipsologyは、FPGAをプラグアンドプレイソリューションとして機能させることで、CPUやGPUのように簡単に使えるようにしたいと考えた。他の種類のアクセラレーションから、可能な限り簡単にFPGAに切り替えられるようにするというアイデアだ。  MipsologyのCEOを務めるLudovic Larzul氏は、EE Timesのインタビューに応じ、「Mipsologyのアイデアを実現する最適な方法は、FPGAの最上部にあるソフトウェアの透明性を確保することだ。これは、NVIDIAが以前に、『CUDA』と『cuDNN』によってGPUの完全な透明化を実現した時と同じ手法である」と述べている。  ここで重要なのが、移行の際にモデルの再トレーニングが不要なため、AIに関する深い専門知識やFPGA関連のスキルなどを持たない設計者でも対応できるという点だ。  Larzul氏は、「さまざまなAIプロジェクトを見てみると、ニューラルネットワークの設計を手掛けたAIチームとやりとりできていないケースが多い。このため、使い勝手の良さは非常に重要である。一般的に、例えばロボットシステムやビデオ監視システムなどを導入する場合、ニューラルネットワークの開発やトレーニングなどを担当するチームや関係者たちを、別で確保する必要がある。さらに、トレーニングが完了したモデルを入手した後は、専門家がいないため、それを変更する気にはならないようだ」と述べている。  Xilinxには、ニューラルネットワークアクセラレーターエンジン「xDNN」があるが、なぜサードパーティーのソフトウェアをサポートするのだろうか。  Larzul氏は、「一言で言うなら、『より良い取り組みを進めるため』だ。または、『それが当社の仕事だからだ』とも言えるだろうか」と述べる。  同氏によれば、Zebraに搭載された独自の演算エンジンは、顧客の既存のCNN(畳み込みニューラルネットワーク)モデルをサポートしている。一方のxDNNは、多くのデモをサポートしているものの、カスタムのニューラルネットワークにはあまり適していない。そのため、xDNNでカスタムネットワークを立ち上げて実行するのは負担が大きいという。xDNNは、GPUとは異なるアプリケーションで勝負できるが、Zebraを使うことで、FPGAがGPUに真っ向から対抗できるようにする。 コストがネックになるGPU  Larzul氏によると、GPUソリューションからの変更の動機は、ほとんどがコストだという。「ハードウェアのコストを下げたいが、ニューラルネットワークを再設計したくない、という要望が多い」(同氏)  FPGAはチップサイズが比較的小さく、GPUを含む他のアクセラレーターよりも低温で動作することが多いため、信頼性にも優れているという。これは、長期的なメンテナンスコストが大きくなるデータセンターでは特に重要だ。  また、Zebraを使うことで「FPGAは性能で勝負できるようになる」と同氏は強調する。FPGAは通常、他のアクセラレーターに比べてTOPS(つまり演算性能)が低いが、入念に設計されたZebraのコンピュートエンジンと組み合わせることで、TOPSをより効率的に利用できると同氏は述べる。  Larzul氏は「これは、AIを加速するASICを手掛けるほとんどのスタートアップが忘れてしまっていることである」と語る。「FPGAをベースにしたZebraのエンジンは、処理能力が6倍(TOPSの値が6倍)のGPUよりも、1秒間に処理できる画像の数が多いのだ」(同氏)  Zebraのエンジンは、画像処理で主に使用されているCNNだけでなく、BERT(Googleの自然言語処理モデル)にも適用できる。将来的には、LSTM(Long Short-Term Memory)やRNN(Recurrent Neural Network)を含む他のタイプのニューラルネットワークをカバーする可能性があるという。 【翻訳:田中留美、編集:EE Times Japan】

EE Times Japan

【関連記事】