絶対知りたい“次”の生成AI、「次世代LLM」「エッジ駆動」「動画RAG」とは?
エッジデバイスでのLLM稼働が現実に、金融はどうなる?
LLMといえば、クラウド環境で巨大な電力を消費しながら稼働するイメージがあります。実際にはこの2024年に入って相対的にフットプリントの小さなSLM(相対的に小型の言語モデル)が続々と登場しており、プライベート環境で動かすことも珍しくなくなってきました。 現時点では、未だ精度などの性能は限定的ではあるものの、スマホのみで動くサイズの言語モデルも出現しています。たとえば、メタがリリースしているLlama 3.2 3Bという言語モデルは、iPhoneやAndroidの上位機種でローカル稼働させることが可能です。筆者も実際に動いているiPhoneの実機を触ってみましたが、実用に耐えるレベルのレスポンス速度でした。 グーグル、アップルともに、OSに生成AIの機能を組み込むことを発表しており、2025年以降、スマホをはじめとするさまざまなエッジデバイス(スマホやIoTデバイスなどの機器)で言語モデルがローカル稼働することが普通になっていくでしょう。 これは、ユーザーとのインタラクションの質を根本的に変える一大転換となるかもしれません。つまり、単に処理速度が速くなるだけではなく、ユーザー体験全体がリアルタイムでダイナミックに進化するということです。 例をいくつか考えてみましょう。金融アプリがユーザーの動きをリアルタイムで捉え、瞬時にフィードバックを返すことができるようになると、たとえばポートフォリオの状態や市場の動きに基づいて、その場でリスクを通知したり、アクションを促すことができるようになります。 これまでの金融サービスが提供していた「一方通行のアドバイス」とは違い、ここではユーザーの動きが即座に反映され、その反応が次のアクションを導くという、リアルタイムのフィードバックループが回せるというわけです。 あるいは、その場での「インタラクティブなコーチング」もできるようになるかもしれません。たとえば、あるクレジットカードを使おうとしたときに、今の予算状況に応じて「この支払いは翌月の家計にどれだけ影響するか」を即座に知らせてくれるとしたら、どうでしょうか。 これまでは後になって支出を振り返るしかなかった場面でも、その場でAIが判断を助けてくれるわけです。これは、もはや単なるAIアシスタントではなく、個別のファイナンシャルガイドがポケットの中にいるようなものです。 エッジデバイス上での生成AIは、リアルタイムかつインタラクティブな体験を提供し、金融サービスのパーソナライズや効率化を飛躍的に向上させるはずです。 瞬時に応答し、プライバシーを保ちながら個々のデータを安全に処理することで、より親密で、より個別化された金融サービスを提供できる。これにより、金融機関は一段上の顧客体験を実現し得ることでしょう。