スパコン富岳で大規模言語モデル 高い日本語能力、一般に公開
東京工業大や理化学研究所、富士通などのチームは10日、スーパーコンピューター「富岳」を活用し、日本語能力に優れた生成AIの基盤技術「大規模言語モデル」を独自に開発したと発表した。企業や大学がダウンロードして使用できるほか、一般市民も富士通のホームページから試すことができる。 大規模言語モデルは欧米や中国だけでなく、日本でも大学や企業が開発を進めている。今回は富岳を含めて国産の技術を活用し、学習に使う日本語のデータも独自にまとめた。 チームはインターネット上の文章を蓄積するデータベースから質の高い日本語の文章を選別。富岳を使ってAIの学習を進め、1年弱で完成した。敬語や日本文化を背景とした会話を自然にこなせるのが特徴だという。 生成AIの開発にはGPUと呼ばれる半導体が適しているが、米エヌビディアなど海外企業がシェアの大半を占め、世界的な需要に追い付いていない。富岳はGPUを使っておらず、チームは今回CPUによる計算速度を6倍に高め、国産スパコンでも生成AIが開発できることを示した。