スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説（生成AIウィークリー）

2/5(月) 15:53配信

「MobileDiffusion」

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第32回目は、生成AI最新論文の概要5つを紹介します。【画像】“本当に”オープンな強力言語モデル「OLMo」

“本当に”オープンな強力言語モデル「OLMo」、アレン人工知能研究所などが開発

言語モデル（LM）は、自然言語処理（NLP）の研究や商業製品に広く利用されています。商業的重要性が高まる中、最も強力なモデルは独自のインタフェースの背後に隠され、そのトレーニングデータやアーキテクチャの重要な詳細が非公開になっていました。これらの詳細を科学的に研究するためには、研究コミュニティが強力で真にオープンなLMにアクセスできることが不可欠です。マイクロソフト共同創設者である故ポール・アレン氏によって設立された非営利研究機関「アレン人工知能研究所」（Allen Institute for AI、AI2）と米国の大学による研究チームは、“本当に”オープンな最先端の言語モデルフレームワーク「OLMo」（Open Language Model）を開発しました。 OLMoは、モデルの重みと推論コードのみを公開してきた先行研究の多くとは異なり、トレーニングとモデリングのコード、トレーニング済みモデルの重み（500以上の中間チェックポイントを含む）、トレーニングデータセット（Dolma）、データセット構築ツールキット（Dolmaのツールキット）、さまざまな評価コードなどが提供されています。また、トレーニングログ、アブレーション、Weights & Biasesログ、指示チューニングとRLHFを用いたOLMoの適応版、そのトレーニングと評価コードなども将来的に公開される予定です。 Dolmaデータセット上で約2.46兆トークンまでトレーニングした「OLMo-7B」を他の公開されている言語モデルと比較しました。これにはLLaMA-7B、LLaMA2-7B、MPT-7B、Pythia-6.9B、Falcon-7B、RPJ-INCITE-7Bなどが含まれます。OLMo-7Bは、評価された9つの主要なタスクのうち2つで他のモデルを上回り、8つのタスクで上位3位以内にランクインしました。

次ページは：推論効率の良い新たな視覚言語モデル「MoE-LLaVA」はLLaVA-1.5-7Bを上回る性能

1/3ページ

Yahoo!ニュース

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説（生成AIウィークリー）

“本当に”オープンな強力言語モデル「OLMo」、アレン人工知能研究所などが開発

【関連記事】

アクセスランキング（IT総合）

雑誌アクセスランキング（IT・科学）