サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
株式会社サイバーエージェントは、75億パラメーターの日本語VLM(大規模視覚言語モデル)のベースモデルをHugging Face Hubで公開した。Apache-2.0ライセンスで提供されており、商用利用も可能だとしている。 この日本語VLMは、サイバーエージェント独自の日本語LLM「CyberAgentLM2」をもとに、視覚――画像中の情報を読み取る機能をを付与したもの。同モデルをベースとしてチューニングすることで、画像を加味した対話AIなどの開発が可能になるとしている。
INTERNET Watch,植田 むつき
【関連記事】
- 【清水理史の「イニシャルB」】“PCで自宅ChatGPT”がかなり手軽に! GUIで簡単導入でき日本語もOKの「Text generation web UI」 サイバーエージェントの「OpenCALM」を動かしてみた
- サイバーエージェント、「最大68億パラメーターの日本語大規模言語モデル」を一般公開
- 【清水理史の「イニシャルB」】賢いと噂の日本語LLM「ELYZA」をウェブAPIで使う! Power Automateなどからも呼び出せる完全ローカル環境の構築
- rinna、日本語LLM「Youri 7B」シリーズを公開。Llama 2を日本語データで継続事前学習
- 【清水理史の「イニシャルB」】自宅PCで「rinna」の日本語言語モデルを試用、メモリ32GBあればCPUだけでも動くぞ!