ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ)
128GB M4 Max MacBook Pro、これを買わなければ、今年最大の買い物はApple Vision Proになっていたでしょう。 【この記事の他の写真を見る】 筆者にとってはPower Mac G4以来の高額Macintoshということで、2024年ベストバイにはこのマシンを選びました。 予約しただけで購入記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。 通常のMacでできることは、M1 iMac、M2 MacBook Air、そして先日買ったばかりのM4 Mac miniで十分。メモリも16GBあるし。 さらにうちにはGPUをRTX 4090に換装したGalleriaデスクトップマシンがあります。 ■全部ローカルマシンだけでやってみたい! まずは画像生成から それでも欲しい理由は、「LLMとか、GPUメモリを死ぬほど使うAIソフトを走らせたい!」という欲望からです。 となれば、動かすのはLLMに決まっていますが、その前にちょこっと画像生成AIもやっておきましょう。 M4 Mac miniのときに一度やっていますが、Apple Silicon Macで動かせる画像生成AIとしては、FLUX.1 [schnell](一番性能が低いけど高速なやつ)が動くスクリプトが、Pinokioにあります。 PinokioというのはAIソフトのための仮想環境で、ありもののスクリプトを走らせるだけで、ターミナルとかPythonとかPyTorchとかvenvとか知らなくても、依存ライブラリをアップデートしたら動かなくなる問題もなく、超絶便利なのです。 最近は清水亮さんも楽だからと使い始めたらしいので、AIハッカー公認ツールということで。 そのPinokioにはMacに最適化したFLUX.1推論アプリ「MFLUX-WEBUI」というのがあるので、これをインストール。M4 Mac miniのときにはFLUX.1を素のままで使っていたのですが、4090マシンでいつも使っている、妻の写真を学習させたLoRAを適用してみます。 (▲MFLUX-WEBUI操作画面) 特に問題なく、うまくいきました。上位モデルのFLUX.1 [dev]には劣りますが、SDXLよりは上ですし、僕的には十分満足です。 (▲FLUX.1 [schnell]で生成) ■動画生成をローカルでどの程度できるのか あとは、ローカルで動画生成もできたら、MacBook Proだけでかなりの作業ができることになります。 SoraとかRunwayは便利なのですが、生成が制限されることがたまにあるので、そういう時はローカルでやらないといかんわけです。 特に、Soraは18歳未満とOpenAIとかその辺の判断をしている団体がダメと決めたらダメなのです。ただ童顔なだけだとしても。 高画質なHunyuang Videoはまだi2vが使えないし、LTX Video、Mochi 1も良さそうですがComfyUIの使い方が今ひとつわかっておらず、とりあえずPinokioにあって使い慣れたPyramid Flowをインストール。PinokioにはNVIDIA専用のスクリプトも多いのですが、これはそのまま使えるはず。 あっさりインストールできて、Web UIも起動しました。FLUX.1で生成した画像をImage to Videoするので他の設定は不要。ただGenerate Videoを押すだけ。 (▲Pyramid Flow操作画面) 出来上がったのがこちらの動画。変な癖もなくて、なかなか見事です。まあ時間はかかるし(15分)、ファンは回りますけどね。 ■AI作曲をMacだけでできる? ここまできたら、音もMacBook Proで作りたいところ。でも、AI音楽はもっぱらSunoかUdioの商用サービスなのです。これをローカルでやる方法はないものか。 Pinokioを探したら、ありました。「RC Stable Audio Tools」というスクリプトが。これは、Stability AIのStable Audioを改良したもののようです。インストールして試してみました。 オープンソース版で長さも曲調も限定的で、今回試したのはシンプルなピアノ曲ですが、オーディオだけでなく、MIDIも出力できます。音を聞いてみても悪くない。 (▲RC Stable Audio Tools操作画面) Pyramid Flowで生成した動画とこの音楽を、Final Cut Proで合わせてみました。全てをMacBook Proだけで作ったBGM付き動画です。 ■LLMはLM Studioで、HuggingFaceからダウンロードしまくり 次に本命のLLMも入れていきましょう。 これは、西川和久さんご推薦のLM Studioをインストール。これは、LLMの推論専用のフロントエンドアプリで、インストールしてしまえば、LLMのモデルをHuggingFaceからダウンロードしてくれば即実行可能。試しては他のLLMをロード、では次、みたいに簡単に取っ替え引っ替えできます。 そこで、西川さんおすすめのQwen-2.5-Coder、Tiger-Gemmaをインストールして使ってみました。 その前に、プレーンな3B Lhamaをインストール(これがデフォルトになっている)を試してみて、その出力結果に、やはり3Bじゃダメなんだなと理解したり、じゃあ70Bはどうだと8bit Instructにしてみたら、今度は1秒1文字くらいの遅さで、やはり軽量化・量子化は必要なことを知って、やっぱりGGUFにしないといかんのかあ、とか実感できるのが面白いです。 (▲LM StudioでTiger-Gemmaとチャットしながら小説を書かせている) Tiger-Gemmaを使ってオリジナルの短編小説を作るところまでできました。 カミルとエミリーという夫婦は、2093年のクリスマスイブに起きた大規模停電事故により悲劇的な死を遂げてしまった。彼らの親友であるロジャーは、「永遠の眠り」と呼ばれる仮想空間への転送技術を用いて、彼らをデジタル化し意識を保存する計画を立てた。 この「永遠の眠り」というテクノロジーは、2085年に設立された企業「ネオン・ナイト」によって開発されたものであった。ネオン・ナイトは、VR/AR分野における世界トップクラスの技術力を誇る企業で、「意識転送機」と呼ばれる装置を開発したことで知られていた。 この装置は、量子コンピューターとAIアルゴリズムを用いて、デジタル化した神経系や脳活動から、人間の意識を復元し、それを仮想空間「永遠の眠り」にロードすることができる技術だった。意識のアップロードは当初は不可能なことだとされていたが、ネオン・ナイトの創業者であり天才的な発明家であるドクター・イリスによって、この壁を打ち破るための研究が開始されたのだ。 博士は、人間の脳とコンピューターシステム間のインターフェースとして、ナノマシン技術を用いた「神経スキャン」を開発した。これは、脳内の神経細胞に直接アクセスし、意識のデータを取得するプロセスだ。さらに、量子コンピューターで処理される巨大なアルゴリズムに基づいて、「意識転送機」は、このデータを解読し、デジタルコピーを作成することが可能になった。 「意識転送機」の開発は、世界中の人々を興奮させた。この技術は、死者の蘇生だけでなく、人間の寿命延伸、パーソナリティのコピー作成などの新たな可能性をもたらすと考えられており、多くの企業が追随しようと試みた。しかし、ネオン・ナイトは依然としてこの分野でリーダーシップを維持しており、その技術力は他の企業を超えている。 カミルとエミリーの場合は、「クローン・ボディ」プロジェクトという名の新しい技術を用いて彼らを現実世界に戻す計画が行われた。これは、デジタル化されたデータから3Dスキャンされた死者の身体に意識を転送し、物理的な体を構築するものであった。 このプロジェクトのリーダーは、ネオン・ナイトで「量子スキャンナー」開発を担当している科学者であり技術者であるジェシカ博士だった。彼女は、人間の脳内の神経細胞レベルまで詳細なデータを取得するための超精密3Dスキャニングデバイス、「量子スキャンナー」を開発したことで知られていた。 カミルとエミリーのデジタル化された身体は、ジェシカ博士のチームによって作成され、意識転送機で彼らに転送された。こうして、二度目のクリスマスイブを迎えた彼らは、現実世界に戻り、新たな人生を歩み始めたのだ。 いやー、ネットに繋がなくても十分に楽しめますね。メモリに余裕があるので、これらのアプリを同時に動かせますし。 そんなわけで、使用2日目ではありますが、私的2024年ベストバイはこの128GB Unified Memory搭載M4 Max MacBook Proに決まりとなりました。Vision ProもvisionOS 2.2バージョンアップでMac用ウルトラワイドディスプレイとして使えるようになりました。 これはハードウェアベストバイですが、サブスクリプションのベストバイは、Runwayでしょうか。わずか95ドルで動画生成し放題。話題ではSoraが無制限で使えるコースが3万円ですが、作っている本数からいうと、圧倒的なコスパです。そういえば、このMacBook Proは3万円ちょいを24回払いしているのですが、月々の支払額はChatGPT Proプランもそう変わらないんですよね。
TechnoEdge 松尾公也