チューリング、生成AIを使った完全自動運転AI「TD-1」とGPUクラスタ「Gaggle-Cluster」
生成AIを使った完全自動運転を目指すTuring(チューリング)、NTTPCコミュニケーションズ、NTTドコモ・ベンチャーズは2024年10月30日、東京都内で記者会見を開き、完全自動運転開発のための専用計算基盤であるGPUクラスタ「Gaggle-Cluster」を運用開始し、同計算基盤を使って開発した自動運転AI「TD-1」を使った車が走行試験を開始したと発表した。 【画像】チューリング 代表取締役 山本一成氏 チューリングは2021年8月創業の自動運転スタートアップ。カメラ画像のみを使ってステアリング、アクセル、ブレーキなど、運転に必要なすべての判断をAIが行なうE2E(End-to-End)の自動運転システムを開発している。累計資金調達額は60億円。従業員数は45名。代表取締役の山本一成氏は初めて将棋名人に勝利した将棋ソフト「Ponanza」の開発者としても知られている。 ■ 完全自動運転AI開発専用GPUクラスタ「Gaggle-Cluster」 チューリング 代表取締役の山本一成氏は、会見でまず、「自動車という産業が興味深かった。テスラが現れて、ソフトウェアやEVなど従来のクルマ会社とは違う側面で世界を塗り替えようとし始めた。自分もグランドチャレンジをしたいと考えた」と述べ、「ハンドルのない車による完全自動運転」を目指す同社のミッションを改めて紹介した。 チューリングはあらゆる条件下での運転タスクの実施を目指す「完全自動運転」に向けて、複数種類のデータを用いて高度な判断を行なうマルチモーダル生成AI「Heron」、リアルな運転シーンを動画として生成可能な自動運転向け生成世界モデル「Terra」、画像から得た運転環境を自然言語で詳細に説明し適切な経路計画を生成することが可能な自動運転向けVLAモデルデータセット「CoVLA Dataset」などの開発を通じて、2030年までにハンドルのない完全自動運転車の実現を目指している。 山本氏は「人間がどう動くかを理解する必要がある。そのためのAIを開発しようと考えた」と述べ、1つのニューラルネットワークで車両を制御するEnd-to-Endの自動運転の考え方と、生成AIが必要だと述べ、「それらの学習のためには大規模なGPU計算基盤が必要だ」と続けた。 自動運転AI開発のための計算資源として構築したのがGPUクラスタ「Gaggle-Cluster(ガグルクラスター)」だ。大規模モデル学習専用として設計された計算基盤で、2023年11月より構築を進め、稼働開始は2024年9月から。NTTPCコミュニケーションズによる技術的な支援と、NTTドコモ‧ベンチャーズによる出資などの支援によって実現した。 「Gaggle-Cluster-1」の構成は96基のNVIDIA DGX H100×12ノード。NVIDIA InfiniBand/NDRを用いたネットワークにより、大規模AI学習で複数のGPUを同時に使用する際にボトルネックとなっていたサーバー間の通信速度の制約を最小化している。またAll-Flash分散ストレージを採用することで分散学習における性能を最大限に引き出しており、クラスタ全体を「単一の計算機」として活用でき、大規模なディープラーニングタスクに最適化されているという。 ノードあたり帯域は3.2Tbps。全ノードのGPU同士が400Gbpsで通信できる。ストレージはノードあたり10GiB/s以上、ストレージ全体で100GiB/s超の速度がある。 「Gaggle-Cluster」という名称は雁の群れが力を合わせて大空を飛ぶ姿から着想を得た。多数のGPUが集まり、協力して大規模な計算課題に挑む様をイメージしている。筐体のデザインは都市から計算機にデータを集約し、AIモデルとして実体化して、再び都市へと還元する流れをイメージしているという。山本氏は「1つの理想を実現できた」と語った。 ■ 2025年12月までに都内を30分走行できる完全自動運転車の実現を目指す チューリングは9月から稼働開始した「Gaggle Cluster」を活用して、独自の自動運転AI「TD-1」を開発し、実車による走行試験を10月半ばから開始している。 「TD-1」は複数カメラからの入力に対して、周辺地図・車両/歩行者の認識、運転操作、未来の経路を単一のモデルで直接出力するTransformerモデルだ。チューリングが取り組んでいる、2025年12月までに人間の介入なしで都内を30分間走行できる自動運転システムを開発するプロジェクト「Tokyo30」のための自動運転AIである。 「Gaggle-Cluster」は自動運転AI開発のほか、生成AIの開発にも活用されている。チューリングは2024年8月には自動運転向け生成世界モデル「Terra」、9月には自動運転向けVLAモデルデータセット「CoVLA Dataset」を、それぞれ国内初として発表した。チューリングではこれらのモデルを活用することで、現実世界の物理法則や物体間の相互作用など複雑な状況を理解した上で高度な判断が可能な自動運転システムの開発を進めている。 山本氏は「我々が目指す自動運転モデルは世界を理解する必要がある。予想結果や自分がどう進むのか、人に説明する必要がある。サブタスクを解くことで経路を生成しようと考えている」と述べた。 ■ NTTPCコミュニケーションズはクラウド計算基盤でバックアップ GPU基盤を担当したNTTPCコミュニケーションズの代表取締役社長の工藤潤一氏は、同社によるGPUサーバーをの販売を開始した2017年ごろの話を振り返り、スタートアップとのつきあいが必要だと考えたと述べ、パートナー企業との共創への取り組み「イノベーションラボ」を紹介。計算資源や資金面でスタートアップをサポートしている。 チューリングの「Gaggle-Cluster」もその1つ。「GPUプライベートクラウドをベースにして、Gaggle-Clusterも動いている」と紹介し、「GPUサーバーのパフォーマンスを最大限に引き出すためには非常に時間がかかる。従来はオンプレミスで構築することが多かったが非常に時間もコストもかかる。我々がここを代行することでビジネスの加速化を支援できる」と述べた。 稼働開始後の保守運用もNTTコミュニケーションズが担当する。NVIDIAとも強固なネットワークを持ち、「調達もさまざまなルートから最適なパーツを選定できる」と述べ、「運用力、技術力、経験から、さまざまなレイヤーのトップレベルの技術力を持っている。GPUサーバー運用は総合格闘技。NTTPCコミュニケーションズは総合技術力があると自負している。これからもさまざまな課題解決に寄与していきたい」と語った。 ■ NTTドコモグループとの新たな価値創造を目指す NTTグループ全体のCVC(コーポレート・ベンチャー・キャピタル)としてスタートアップへの投資を行なっているNTTドコモ・ベンチャーズ 代表取締役社長の安元淳氏は、同社の事業概略を紹介。世界中のスタートアップとNTTグループを紡ぎイノベーションを生み出すことを目的とし、2008年以降、同ファンドの運用金額は累計1,050億円に到達しており、国内でも最大級のCVCとなっている。投資対象地域は東京とシリコンバレーを拠点に、グローバルに投資を行なっている。日本への投資割合は53%。 ドコモのファンドからチューリングへの投資を発表したのは2024年4月。将来の事業創出、ディスラプティブな領域として生成AIに着目しており、チューリングへの投資を決めたという。従来のルールベース方式ではなく生成AIを使った完全自動運転の実現を目指して、NTTドコモグループのアセットを提供している。将来的には、MaaS領域において従来とはまったく違ったBtoCのビジネス展開への期待があると語った。 ■ 世界を理解する完全自動運転の先はヒューマノイド開発 なお、今回の話はあくまで学習とモデル作成の話で、推論実行の話ではない。また、完全自動運転を実施するにあたってはクラウド経由での処理ではなくスタンドアローンである必要がある。 「ルールベースではなくAIモデルだと説明が難しい懸念があるのではないか」という質問に対してチューリングの山本氏は「将棋に関してもルールベースを廃したプログラムで考えていた。自動運転実現はピュアなルールベースだけではおそらく不可能。現実的ではない」と述べ、「我々が作るべきは圧倒的に安全なもの。コードを追えば分かるからといっても100万行のコードからなるプログラムは現実的には説明可能でもない。圧倒的に言えることは『自動運転システムが安全であること』が社会における許容だ。『End-to-EndのAIが説明可能か不可能か』が議論のベースではない。重要なことは事故を起こすか起こさないかだ。AIという新しいツールが社会に入っていくのは大変だが、圧倒的に安全なものを作ることが我々の使命だ」と答えた。 チューリングでは2030年に完全自動運転を実現したいとしている。資金面について質問された山本氏は「ボトルネックはAIがこの世界を人間のように理解していないこと。特に『身体性』を介して理解していない。自分がこう動くと他人はこう動く、自分がハンドルをこうきると、車体はこう動く、あれは柔らかい、硬いといったことは理解していない。2030年まではいったん今の資金調達額で走り切りたいと思っているが、身体性の理解のためには、もう一桁上げたいとも思っている。 ただ、大きな組織が大きな金額を使えば勝てるわけではない。小さな集団が始めたことが大きくなっていくことはよくあること。テスラはなぜトヨタに比肩する企業になったかを考えたい。AI開発においては方向性を示して組織を動かすことが資金以上に重要なことだと確信している」と語った。 なおチューリングは、国内の生成AIの開発力強化を目的として経済産業省及びNEDOが協力して実施する事業「GENIAC(Generative AI Accelerator Challenge)」にも参画している。GENIACでは、あらゆる運転環境において人間の運転を完全に代替するため、高次の認知/理解/判断能力に加え、実世界での行動を可能にする「身体性」を持つマルチモーダル基盤モデルの開発を目指している。テキストや映像、センサーデータを統合的に理解し、運転環境における周囲の移動体や環境の変化をリアルタイムで予測する。日本語を含む多言語対応の大規模言語モデルを基盤とし、視覚情報と自然言語の統合的理解、三次元空間の認識、物理法則に基づく環境変化の予測能力を高めるためのデータセットを構築するとしている。 山本氏は「実際にAIシステムが身体性をもって理解できるようになれば、完全自動運転車は商業的に成功したロボットになる。車をロボットというと違和感があるかもしれないが、ある程度大きな機械を自律的に動かすとなると、自動運転とヒューマノイドを動かす技術はほぼ同じ。いま米中でヒューマノイドの開発が活発になっている。自動運転のあとにヒューマノイドを作るのがチューリングという会社だ」と述べた。 そして「生成AIは常識を内包することで、学習をスキップしている。言葉も話すし運転もできる。入力も出力もモーダルを増やすことで、効率的に学習を進めることができる。これはチャンスだ。生成AIもアメリカが圧倒的に強いが、どんどん作っていけばいい。日米にすごい差があるわけではない。自動運転を作っていく集団にくらいついていくことが重要」と語った。
PC Watch,森山 和道