ロボットに”大脳”を提供~エンボディドAI開発の「X Square」が資金調達、複雑で細かな操作も実行可能に
これまでのようにシーンごとに分けるやり方ではモデルの汎用性を向上させるのは難しい。そこでX Squareはロボットのタスクを大きく2つに分けた。ひとつは、マルチモーダル大規模言語モデル(LLM)が人の指示と意図に基づいて高次元の推理と立案を実行する部分。もうひとつはロボットの基盤モデルが計画に基づいてエンドツーエンドで動作を実行する部分だ。X Squareはソフト・ハード両方の研究能力を持ちLLMに精通していることから、物理世界におけるコミュニケーションとLLMの訓練を組み合わせて、LLMの汎用操作能力を進化させた。 簡単に言うと、X Squareが自社で開発したロボット用基盤モデルのプラットフォームは、マルチモーダルLLM、ロボット制御用LLMとロボット本体を組み合わせたものということだ。 X Squareによると、自社で研究開発した基盤モデルはすでに世界の先進レベルにあり、複雑で細かな操作を実行できるようロボットを訓練することが可能だ。野菜やウインナーなどかたちが不規則なものや表面がツルツルしたものを細かくカットできるほか、スプーンを使って缶の中からジュースの粉をコップに入れ、水を注いでジュースを作ることもできる。 Hao Wang CTOによると、ロボット向け汎用モデルのコアはデータ訓練だという。「データだけなら世界各地にアウトソーシングすることが可能だが、ロボットの場合はソフトとハードの一体化、データとモデルを一体化する能力が求められる」。また中国は世界の製造業の中心であるという点で有利だとして、「中国がLLMに取り組み始めたのは米国より遅かったが、エンボディドAIの基盤モデルではほぼ同時にスタートした」と捉えている。 X Squareは企業と一般消費者の両方に向け、ビジネス化を進めている。William CEOは、エンボディドAIが人々の予想よりも早く実用化され、3年から5年のうちにビジネス利用が始まると考えている。 *2024年4月4日のレート(1元=約21円)で計算しています。 (翻訳・36Kr Japan編集部)