AIにロボットの身体を与え、生命科学研究のラボを自律化する基盤モデルを開発(高橋恒一氏/理化学研究所生命機能科学研究センターチームリーダー)
生命科学分野の基盤モデルもさまざま開発されています。例えばscGPT、Geneformerなどの細胞の遺伝子発現データの基盤モデルでは、数千万個の細胞データを事前学習して、分類や遺伝子の相互作用の推定などさまざまなタスクに対応できます。
もう一つ重要なのが、タンパク言語モデル。タンパク質のアミノ酸配列を学習させたモデルで、米メタが開発したESM-2では、6500万本のアミノ酸配列を学習させたことでタンパク質の立体構造予測能力が創発したという結果が出ています。
生命システムを「マルチモーダル」として統合へ
問題は、ビッグデータはいつか枯渇すること。では、どうするのか。解決の鍵は「身体性」と考えています。つまり、基盤AIに自らの知識が不足している部分に関する実験条件と結果予測を生成させた上で、ロボットに実験を行わせ、返ってきた実測データと予測の誤差情報を使って学習するサイクルをつくると、ビッグデータがなくてもどんどん賢くなるAIがつくれるというわけです。
そのアイデアをもとに、今年4月、理研では新しい研究組織である科学研究基盤モデル開発プログラム(AGIS)を立ち上げ、研究を進めています。長期的には複雑な姿をしている生命システムというものを、複数種の情報を同時処理できる「マルチモーダル」な基盤システムとしてデータ駆動で統合できるのではないかと考えています。何年かかるかわかりませんが、目指す価値のある夢だと思っています。 一條亜紀枝/サイエンスライター
プロフィール
髙橋 恒一(たかはし こういち) 理化学研究所 生命機能科学研究センター チームリーダー 1974年秋田県生まれ。1998年慶應義塾大学環境情報学部卒業。2000年慶應義塾大学大学院政策・メディア研究科修士課程修了、2003年同博士課程修了、2004年博士(学術)。専門はロボティック・バイオロジー、計算システム生物学、脳型人工知能など。理化学研究所特別研究員、同基幹研究所・生命システムセンターチームリーダーを経て、2018年より現職。