AIにロボットの身体を与え、生命科学研究のラボを自律化する基盤モデルを開発(高橋恒一氏/理化学研究所生命機能科学研究センターチームリーダー)
異種機器を組み合わせ、実験の処理時間半減
この3要件がそろうことによって、世界中の生命科学研究者が努力して取得した実験データが無駄にならずに、きちんと一つのデータベースに蓄積されていきます。過去に似たような実験があれば結果を参照できるので、巨人の肩に乗れるようになるのです。 この実現のために、我々はまず「記述性」に取り組み、実験プロトコル記述言語「LabCode」を開発しています。一つのプログラムでロボットや実験機器、AIを連携して動かせる高級言語(人間が理解しやすいように設計されたプログラム言語)です。
そのための新しいプログラミングパラダイムを提唱していて、それが「オブジェクト・フロー・プログラミング(OFP)」。一つひとつの実験操作を関数で記述して、有向グラフ(矢印などで方向を示した図)として組み合わせることにより、複雑な実験操作を記述することを目指しています。 実験操作のグラフ表現はさまざまな面で有用ですが、そのうちのひとつは実験室内の機器に対する実験操作の割り振りを最適化できることです。異種機器の組み合わせによって、単一機器を使うときに比べて実験の処理時間が50%ほど短縮できるという結果もあります。
大規模言語モデルを活用し、遺伝子やタンパク質で成果
最後はAIの活用についてお話しします。2024年9月に発表された論文によると、自然言語処理の分野において人間とLLM(大規模言語モデル)の研究アイデアを100人以上の専門家が盲検で評価したところ、新規性とインパクトでLLMが人を上回るという驚くべき結果が得られたそうです。
2024年8月にはサカナAI(東京都港区)が、機械学習研究の全自動化に成功したと発表しました。LLMを使って、研究アイデアの生成から新規性のチェック、実験の計画、コードの記述、実験の実行、論文の執筆までを行い、さらに公開査読データで学習して論文をレビューし、その評価をもとに次のアイデアにつなげることができるといいます。
LLMは基盤モデルと呼ばれる汎用性の高いAIの一種です。重要な特徴が「スケール性」で、コンピュータの計算量、データセットのサイズ、自然言語処理モデルの規模(パラメーター数)を大きくするほど、際限なく性能が向上しているように見えます。