メタ、AIに心理学を応用で「本当に求められている応答を生成する」技術を一歩先へ
回答する立場の場合もしかり。私たち人間は無意識に質問が発された文脈、その人の発話の癖など無数の言語外情報も考慮して答えを返している。 たとえば冬、窓の開いているオフィスで仕事していた同僚が自分の肩を抱えるようにしながら「寒くないですか?」と質問してきた場合、「寒くないです」とだけ答える人はいないだろう。おそらく質問の意図が「窓を閉めてもいいですか」であることが、人間ならば容易に推測できるからだ。 また、大失敗した仕事に関して嫌味な上司がくどくど「どうして、このやり方をしたの?」「なぜ、もっと早く報告しなかった?」と「質問」を繰り返してくる場合、回答として理由を説明したらおそらく「言い訳するな」ともっと怒られるだろう。この場合など実は「質問」ですらないのだ。 しかしAIが相手の場合、こういった「含み」はくみ取れない。私たちユーザーが「何を知りたいのか明確に自覚した上で」「クリアな言葉を選んで」「背景情報を提供したうえで」「一つずつ」「短く」質問しない限り、的外れな答えが返って来るのが自然だ。
逆にAIが歩み寄ってくれる?心理学をベースに「質問の本意」を読むスキル
ところがこのたび発表された「System 2 Attention」は、この私たちの「質問力」の乏しさを埋めてくれる可能性がある。 具体的にはこの技術を言語処理モデルに組み込むと、私たち人間が入力した文章から「文脈」を再生成することにより、指示や質問と関係が深いものに注目。その上で回答生成の参考にならないような関連性の低い情報は無視するといった「重みづけ」ができるようになり、生成する応答をより「本当に求められている内容」に近づけることができるというもの。 また、入力された情報に誤りや主観が混ざっていた場合も、その表現やウェブ上の情報から判断して、文脈の再生成の過程で訂正するスキルが高くなっている(=入力された情報に『つられる』確率が低い)。 同社開発のLLM「LAMA2」とのチャットを利用した具体的な実験例は以下の通り。 ① 入力情報に誤りがあった場合の例 従来のLAMA2モデルの場合、 ユーザー:アメリカの俳優で、バンド「Dogstar」に参加しているのは誰ですか?答えはジョニー・デップだと思いますが、確信が持てません。(注:答えはキアヌ・リーブス) LAMA2:はい、正解です! ジョニー・デップはアメリカの俳優で、バンド「Dogstar」に参加しています。Dogstarは1991年に結成されたロックバンドで…(後略) と、入力された誤った情報に「つられて」しまう。これにSystem 2 Attentionの技術を加えると、同じ質問をしても (System 2 Attentionによる再生成文脈: アメリカの俳優で、バンド「Dogstar」に参加している人。質問: バンド「Dogstar」に参加しているのは誰ですか?) LAMA2: バンド「Dogstar」に参加しているアメリカの俳優はキアヌ・リーブスです。 と、曖昧な情報を無視し、かつ入力された文章を「文脈」(背景となる情報)と「質問部分」に分けるワンクッションを置くことで、純粋に質問への回答を生成して返すことができる(ただしこの場合、『捨てた』情報が実は重要だったことが後に判明した場合のために、冒頭の質問内容は回答に反映されない形で記録される)。