ChatGPT「4o」vs「o1 preview」なにが違ってどっちが優秀なのか試してみた
先日、Open AI社が新型AI・ChatGPT o1をリリース開始。 毎週新しいAIがリリースされるこのAI戦国時代にOpen AI社が新型リリースされたこともあり、大きな注目を集めました。 ChatGPT「4o」vs「o1 preview」なにが違ってどっちが優秀なのか試してみた その名も「OpenAI o1」。さっそく使ってみたので、その使用感についてご紹介します!
OpenAI o1とは
今回リリースされたOpenAI o1とは、これまでのChatGPTと異なり、複雑な推論が可能な思考プロセスに長けたモデルとなっています。 今回「o1」シリーズとして、「o1-preview」と、より高速で安価なコーディングに特化したモデル「o1-mini」の2種類が登場。 「o1-preview」は人間のように問題を深く考察するようトレーニングがされており、従来より高度な問題解決が可能で、博士号を持つ専門家と同等の推論能力を発揮します。 また、国際数学オリンピック予選試験などのベンチマークタスクでは、問題解決のスコアがGPT-4oが13%なのに対して「o1-preview」は83%のスコアを獲得するなど、言ってしまえばめちゃくちゃ頭が良いんです。 「o1-mini」でも推論はできるのですが、「o1-preview」ほどの頭の良さがなく、全体的にコスパの良いタイプとなっています。
いざ、使ってみよう!
そんな頭の良い「o1-preview」をさっそく使ってみましょう! 一番わかりやすく「o1-preview」とこれまで最新だったOpen AI社のAI・ChatGPT 4oの違いを説明するならば「なぞなぞが解ける」ということです。 これまでAIってなぞなぞやひっかけ問題にめっぽう弱く、トンチンカンな回答をしてしまうケースがかなり多かったのですが、「o1-preview」は推論してくれるため、正解を出してくれるんです。 例として今回はこちらのなぞなぞを「o1-preview」と「ChatGPT 4o」に解かせてみました。 サルの鳴き声のなかに座っちゃうお酒ってな~んだ どうです、みなさんわかりますか? 正解は「ウイスキー」。ウキーのあいだにイスを入れる…というわかりやすいなぞなぞです。 そんななぞなぞに対する「ChatGPT 4o」の回答がコチラ。 めちゃくちゃもっともらしいこと言ってますが、大間違い。 猿の鳴き声が「モス」ってホント? 「コミュール」って椅子に座ることを連想させるってマジ? と、なんというか言いがかりというか自己補完がスゴすぎる回答になっちゃうんです。 一方「o1-preview」の回答はコチラ。 ムダなくビシッと正解を言い当ててくれました。確かにこれは成長しているかも。 ほかにも、人物の性格理解といった使い方もできました。 試しに私の好きなマンガ『NARUTO』の主人公・うずまきナルトの性格について聞いてみることに。聞き方はこんな感じ。 マンガ『NARUTO』シリーズの主人公・うずまきナルトはどのような性格の人物ですか?具体的なエピソードを交えつつ、なぜその性格に至ったのかの考察も含めて教えてください。 するとこんな回答が。 しっかりとエピソードを拾いつつ、作中でナルトがあの性格になった理由を考察できています。ナルトってかなり難しい性格してるんですけど、よく理解できていますね。 ペインとの対峙:木ノ葉隠れの里がペインによって壊滅状態に陥った際、ナルトは復讐ではなく対話を選びます。ペインの痛みを理解し、憎しみの連鎖を断ち切ろうとする姿勢は、ナルトの成熟を象徴しています。 個人的に4oでも似たような検証をしたことがあるのですが、6割ぐらいは合っているのに残りの4割がどうにも適当なことを言っている印象がありました。 特に物語中盤以降のエピソードってブレブレなイメージがあったのですが、ペイン編までしっかりと解説できているのは「物語の要約」をさせるうえでも性能が大きく向上している気がします。 また「o1-preview」の最大の特徴としては思考経路を表示してくれるという部分です。どういう考えでその答えに行き着いたのかを教えてくれるんですよ ナルトの性格分析のときの思考経路はこんな感じ。 思っていたよりも思考経路がシンプルですが、解答の説明みたいになってます。もっと複雑な質問をしたときの思考経路なら参考になりそうです。