Mistral AIの「Pixtral 12B」「Pixtral Large」とは何か? 手書きからWeb制作も可能に
Pixtralの活用事例:ウェブデザイン
Pixtralの可能性は幅広くあるが、Pixtral 12Bの実際のユースケースの1つとして、ウェブデザインが挙げられている。Mistralの実験によると、以下の手書きのウェブデザインを読み込ませ、HTMLコードを生成させたところ、見事に手書きデザインの要素を踏まえたHTMLが出力されたという。 このHTMLコードを表示すると以下のようなデザインとなる。若干の違いはあるものの、ドロップダウンやNextボタンなど必要な要素はすべて揃っている。 他のウェブデザインではどのように機能するのか、実際に筆者も実験してみた。 デザインの参考として、Canvaで利用可能なウェブレイアウトサンプルを使用。 これをPixtral 12Bに読み込ませ、これと同じデザインのHTMLコードを生成してみた。 一回目の試行で生成されたコードを表示すると、以下のように参考デザインと異なる構造になってしまった。 Pixtral 12Bが他のビジョンモデルと異なるところは、一般的な推論能力が高く、失敗から学習する能力も高い点にある。そこで、この結果をもう一度読み込ませ、修正させてみた。どこまで修正できるのかが試される実験となる。 結果は以下のように、参考デザインどおりの構造に修正することができた。 コーディングでは、OpenAIのGPT-4o、またAnthropicのClaude3.5 Sonnetが有力モデルとなとされてきたが、「Pixtral Large」の登場でそれが覆るのか。あるいは、各モデル効果だったので、簡単なデザイン/コーディングタスクをPixtralに振り分けることで、コストを最適化するといった動きも出てきそうだ。
Pixtralのインストール、利用方法
Pixtralは、Mistralのチャットサービス「Le Chat」、またはAPIで利用することができる。 Le Chatは、以下リンクよりアクセスし、Pixtralモデルを選択。ChatGPTと同じ要領で操作する。 https://chat.mistral.ai/chat また、GPU搭載のPCであれば、「mistral-inference」を通じてローカル環境にインストールすることも可能だ。ターミナルで以下のコマンドを使い、mistral-inferenceをインストールし、PythonでPixtralモデルをダウンロードして利用する。 pip install mistral-inference 詳細はMixralウェブサイトかGitHubで確認可能だ。
執筆:細谷 元、構成:ビジネス+IT編集部