動画から人間の動きを学習、未来の行動も予測。中国の人型ロボット、ボクシング対決に挑戦
人口知能(AI)技術の発展には、質の高いデータの収集が不可欠だ。しかし、十分なデータを集めることは容易ではなく、特にAIロボットやヒト型ロボットへの需要が高まる現在、その実用化に向けた大きな課題となっている。 ボクシングをしている人型ロボットなど、もっと動画や写真を見る ロボットの訓練データは、大きく3つに分けられる。1つ目は実際の遠隔操作のデータ、2つ目はシミュレーションによる合成データ、3つ目は主にインターネット上にある膨大な動画から得られる人間の動きに関するデータだ。 AIに身体性を持たせた「エンボディドAI」を実現できるかどうかについては、高品質かつ多様なデータの確保が鍵となる。この分野に特化したロボット系スタートアップ企業「零次方科技」は、人間の動画データを活用した学習(Learn from human video)というソリューションを提案している。
今年5月に設立された零次方科技は、清華大学と江淮先端技術協同イノベーションセンター(江淮前沿技術共同創新中心)が共同でインキュベートした企業だ。同社のコアメンバーは、清華大学のAI&ロボット知能実験室出身者を中心に構成されており、チームにはバイトダンス(字節跳動)や百度(バイドゥ)といった大手インターネット企業、さらには節卡機器人(JAKA ROBOTICS)などの協働ロボット企業で活躍していた研究者も加わっている。 零次方科技は、現在主流の遠隔操作技術とは異なり、人間動作の三次元(3D)認識モデルを通して、人間の主要な関節の運動データを抽出して、ロボットに再現させることでアルゴリズムの学習コストをある程度削減することができる。 同時に、高精度な3Dシーンの可視化と再現に使われる「4D Gaussian Splatting」技術を活用して、ロボットが観測した空間や動作データを再構築させる。また、イマジネーター(Imaginator)技術を用いて、観測情報を基にロボットにタスク遂行に必要な動作を予測・生成する能力を持たさせる。これにより、人間の動作や環境の変化から直接学習する能力(LFWH)を獲得し、ロボットが自律的かつ効率的に業務を遂行できるようになるという。 同社は9月に両腕ロボット「F1」を発表した。このロボットは、専門的な工場作業に活用されており、その応用範囲を徐々に拡大している。また、10月24日には初の人型ロボット「Z1」を正式に発表した。Z1は、不規則な路面や複雑な地形でも安定して歩行でき、あらゆる方向から強い衝撃を受けても安定した姿勢を保持できるという優れた耐性を備えている。 150Nm(ニュートンメートル)の関節モーターを搭載し、27の可動部分を持つZ1は、最大20kgの荷重テストに耐え、荷重自重比は70%以上を達成。さらに、自社開発の産業用オープンネットワーク「EtherCAT」を活用することで、低遅延・高速通信を実現している。 現在、零次方科技はSF映画「リアル・スティール」に登場するロボット格闘技のシーンをロボットに学習させようとしており、すでに人間の腕の動きを正確に再現している。デモ映像では、Z1は人間の動作を観察し、それを模倣することで攻撃方法を習得し、全身を連動させたダイナミックな防御もできる。 創業者の閔宇恒氏は、年末までに人間の操縦なしで行う人型ロボット同士のボクシング対決大会を開催する計画だと語り、「メカの夢」を実現する意気込みを示した。 (36Kr Japan編集部)