AI最新技術のロボティクス産業への融合が急加速 AI時代のロボット開発競争最前線
全3階層のAIによりロボットが連鎖的に思考と行動を実行
Menteebotのオペレーションは3階層から構成され、その全てにAIが搭載されている。 まず第1階層は言語領域。トランスフォーマーベースのLLMを使って指令内容を解釈し、タスクを完了するために必要とされるステップを構築する。 第2階層は視覚領域で、NeRFベースのアルゴリズムを使い、周辺環境の3D認知マップをリアルタイムで作成。そこにはオブジェクトの意味情報も含まれる。そしてロボット自身がその地図のどこにいるかと認識し、障害物を避けて目的地まで行く道筋を策定する。 最後に策定されたステップに沿ってタスクを実行する。その際にはSim2Real(Simulator-to-reality)の機械学習により、シミュレーション環境下で規定された動きを、現実環境でのロボットの手と足の動きに落とし込んでいく。 このように、Menteebotは1段階ずつの指示を与えなくても、複雑な指令を自ら分解し、連鎖的に思考と行動を行い、タスクを完了することができる。これは家庭や工場などの環境下で稼働するヒューマノイドロボットとって、非常に重要かつ画期的なことだろう。 Menteebotは25年第一四半期にも最終版が完成する見通しだ。
Nvidiaは汎用基盤モデルProject GR00Tを発表
AIヒューマノイドロボットの最前線にいるのはMenteeだけではない。テスラやFigure、1X Technologiesなど他のプレイヤーたちも熾烈なスピードで開発を進めている。 Nvidiaは3月にマルチモーダルAIのProject GR00Tを発表。ヒューマノイドロボットが文字、音声、動画、さらにライブデモンストレーションをインプットとし、それを特定のアクションに結び付けてアウトプットすることを可能にする汎用基盤モデルだ。 NvidiaはProject GR00TをAgility Robotics, Apptronik, Boston Dynamics, Fourier Intelligence, Sanctuary AI, Unitree Robotics and XPENG Roboticsといったロボティクス業界の主要プレイヤーに供給。ヒューマノイドロボットのAI性能進化に大きな拍車がかかることは間違いないだろう。