最新版ChatGPT o1の「思考プロセス」を覗いてみよう!より人間らしく進化した
もっと複雑なタスクも扱うことができる
別の問題を試してみようと思った私は、OpenAIが用意した2つ目のプロンプトを選びました。 Generate a 6x6 nonogram puzzle for me to solve, where the solved grid looks like the letter Q.(6×6のノノグラム[お絵かきロジックパズル]をつくり、出来上がったマス目が、アルファベットのQに見えるようにしてください) もっと難しい要求をした人は予想がつくかもしれませんが、o1-previewはこのタスクを処理するのに、さっきより長い時間をかけました。正確には84秒です。 o1は要求どおりのパズルをつくり、解き方の説明も示しています。 ドロップダウンメニューをクリックすると、プロンプトを処理するのに36の思考プロセスを経ていることが判明しました。 「パズルの作成」というプロセスでは「私は、答えがアルファベットのQに見えるような、6×6のノノグラムを作成するプロセスについて考察しています。マス目をデザインし、手がかりを導き出し、解くためのパズルを提示する必要があります」となっています。 それから、画像のなかにQの「しっぽ」の部分をどうやって入れるかを考えていました。 そして「しっぽ」をつけるには「どのようにパズルを組むか考える前に、レイアウトのいちばん下の列を調整しなければならない」と判断しています。 これらをスクロールして、o1-previewが考えた道筋をたどるのはとても面白いものです。 どうやらOpenAIは、o1が「考えている」ときには「OK」や「hm(ふーむ)」「I'm curious about(私が知りたいと思うのは……)」などの単語やフレーズを使うよう訓練してきたようです。 おそらく、より人間らしさを出そうとしているのでしょう(私たちが、本当に人間らしさをAIに求めているかどうかは疑問ですが)。 ただし、要求が簡単すぎて回答に2~3秒しかかからないときは、思考プロセスは示されません。 まだ初期の段階ですから、o1がこれまでのAIモデルと比べて大幅に優れているかどうかを見極めるのは難しいことです。 私たちは今後、AIが書いた文章かどうかを判断する手がかりとなる「おかしな言い回し」が、この新たな「考える」プロセスによって本当に改善されているかどうかを知る必要があるでしょう。