NTTの技術で “光が創る未来” を提案「NTT R&D FORUM 2024 IOWN INTEGRAL」開催
業務マニュアルをAIが自分で理解して遂行
NTT独自の生成AI「tsuzumi」の展示では、直近1年の研究成果として「視覚読解能力」と「エージェント能力」を紹介。 視覚読解能力とは写真や表を読み取る能力、エージェント能力とは人間と同じように検索エンジンを利用したり業務マニュアルを理解したりできる能力のこと。これらが優れていることで「指示された商品の検索と業務マニュアルに沿った発注」ができるという。 デモンストレーションでは、商品の写真を読み取った「tsuzumi」が、瞬時に検索ワードに変換し、インターネット上で商品を検索。型番など必要な情報を取得し、さらに業務マニュアルに沿って購買システムに商品を発注してみせた。色違いの複数の型番が載ったリスト(画像データ)をtsuzumiに見せて、特定の色を指定しても同じことができた。 「tsuzumi」が一般的な生成AIと大きく異なるのは「AIコンステレーション」という概念である。これは異なる専門知識を持った複数のtsuzumi同士が会話をして答えを導くというものだ。参照資料によると、AI同士の会話は人間同士のそれよりはるかに速く、タイミングを合わせるために、遅延のない通信が必要なのだという。
脳波で車椅子やアバターを動かす
人間の脳波をAIが判別して動作を再現する「運動能力転写技術」を使えば、手足が不自由な障がい者や、加齢で体を動かしづらい高齢者でも、車いすなどを安全かつ正確に操作できる。また、仮想空間のアバターを動作させることも可能。この技術にIOWNを活用することで、人間の意思に対して遅延のないスムーズな動作の実現が可能になる。
大阪・関西万博での展示と私たちの未来
NTTは、これらIOWNをはじめとした先進的な研究開発の成果を、来年4~10月にかけて開催される「大阪・関西万博」においても展示する予定だ。内覧会の展示で判断する限り、現時点では研究・開発段階の技術も多いが、いつの日か“光”が私たちの生活を大きく変え、人類の未来を明るく照らしてくれるかもしれない。
取材・文・撮影:廣石健悟