エッジAI半導体に注目集まるワケ、日本発のEdgeCortixなどスタートアップも存在感
数年前まで、データの大半はクラウド上で発生していたが、モバイル・エッジデバイスの普及に伴い、エッジ環境でのデータが急速に増えている。そんな中、関心が高まっているのがデータをその場で処理できるエッジAI向けの半導体だ。最新のエッジAI向けの半導体は、生成AIモデルの運用にも対応しており、LlamaモデルやStable Diffusionなどを動かすこともできるという。同市場ではNVIDIA、インテル、AMD、クアルコムといった大手プレイヤーに加えて、日本発のEdgeCortixやHailoなどのスタートアップも存在感を出しつつある。 【詳細な図や写真】注目株の筆頭はイスラエル発のHailoだ(出典:HailoのXアカウント)
生成AIモデルの小型化とエッジAI需要
生成AIの利用はこれまで、パワフルなGPUを搭載したマシンやクラウドへのアクセスが不可欠だった。しかし、AIモデルの効率化と小型化、そしてエッジ環境でのAI利用を可能にするハードウェアの進化により、クラウドを介さずとも比較的高精度なAIモデルの利用が可能になっている。 モデルの効率化と小型化の顕著な例として、グーグルのGemma 2 2Bが挙げられる。2024年7月末にリリースされたこの小型言語モデルは、わずか20億パラメータという非常に小さなモデルでありながら、GPT-3.5を上回るパフォーマンスを示した。 AI研究グループLMSYSの独立評価において、Gemma 2 2Bは1127点を獲得し、GPT-3.5-Turbo-0613(1117点)やMixtral-8x7B(1114点)を上回る結果となったのだ。 エッジAIの可能性を示すもう1つの事例として、Figure社の「Figure 02」の登場も見逃せない。Figure 02はOpenAIの大規模言語モデル(LLM)と人型ロボットの統合を目指しており、人間との音声対話も可能だ。 6つのオンボードRGBカメラと独自の視覚言語モデルを搭載し、周囲の状況を分析して自律的に移動できる。さらに、10本の指と16の自由度を持つ人間の手に近い構造を持ち、最大25kgの荷物の運搬が可能とされる。 SlashDataによると、2018年時点では、エンタープライズで生成されるデータのうち、エッジ環境で生成されたものはわずか10%に過ぎず、その大半がデータセンターやクラウドで発生していた。 しかし2025年には、75%のデータが工場、病院、リテールショップなどのエッジ環境で生成され、その大半はその場で記録/分析されると予想されている。また、こちらはやや古いがガートナーも50%以上のエンタープライズデータがエッジ環境で生成/処理されるとの予測を展開している。 エッジ環境でのデータ急増は、必然的にエッジAIの需要につながる。SkyQuestの予測によれば、エッジAI市場は2022年の156億ドルから2031年には1,859億ドルに成長する見込みだ。