グーグルの「会話生成AI」が超リアルでヤバい…これはChatGPTの登場時に匹敵する「衝撃」だ！

10/11(金) 8:00配信

本物の人間と区別がつかない！

photo by gettyimages

グーグルが先月リリースした新種の生成AIが米国で今、注目を浴びている。各種の文書を読み込んで、それをベースに(ポッドキャストを想定した)軽妙な音声会話を生成するAIだ。【画像】「ペイペイの毒」に潰されたキャッシュレス企業…その残酷すぎる末路本来、同社の文書管理・編集AI「NotebookLM」の派生機能として提供が始まったが、これがユーザーの間で実際に使われ出すと本家を凌ぐ人気となった。とにかく、このAIが生成する男女の音声会話は、本物の人間と全く区別がつかないほどリアルなのだ。また会話の内容も驚くほど充実している。未だベータ版(試験利用)の段階だが日本でもすでに使えるし、日本語の文書も受け付ける。ただし出力される音声会話は今のところ英語のみだ。ちなみに、これによるポッドキャスト番組は「Deep Dive」と呼ばれているが、これは番組のホストとなる生成AI製の男女が自分たちの会話の中でそう呼んでいるに過ぎない。つまりあくまでもポッドキャストに使われる事を想定したAI会話に過ぎず、これが実際のポッドキャスト番組として放送されたことはない。従ってスマホなどで本物のポッドキャスト番組を検索して、そこに「Deep Dive」という番組が現われたとしても、それはグーグルの生成AIが製作したものではない。偶然、同名の(本物の人間による)番組が他に存在しただけの事である。前置きが長くなったが、まずは論より証拠で、実際にそのAI男女による会話をお聴き頂こう。これは先週、NHKのニュースサイトに掲載された「来る衆院選挙」関連の記事を筆者がグーグルの生成AIに入力して作り出した音声会話である(このAIの使い方は後で簡単に紹介する)。念のため断っておくと、この行為は著作権の侵害には当たらないと思われる。

超リアルな会話と驚愕の理解力

このポッドキャスト番組(を想定した会話)を聴いて驚かされる点が、いくつかある。まず番組のホスト役を務めるAI男女の話しぶりがスーパーリアルであることだ。その自然な声、抑揚、文脈に応じて変化する会話速度、カジュアルで豊かな感情表現、あるいは時々の言い淀みや微妙な吃音、さらには会話の間(ま)など、どの要素をとっても本物と人間と全く変わりがない。もしもあらかじめ「これは生成AI製です」と知らされていなければ、恐らく誰もがこれを本物の人間(による会話)と思い込んでしまうだろう。これとは別に、いやそれ以上に驚かされるのは、この生成AIの高度な理解力、それが網羅する知識の広さ、適切な比喩なども織り交ぜた豊かな表現力、さらには時折覗かせる軽いユーモアや創造性の萌芽である。これを聴いた限りで判断すれば、この生成AIは会話のベースとしてあらかじめ入力された選挙報道の記事をほぼ完璧に理解している。しかもその内容を単に追っているのではなく、ときに構成を変えたり、そこに独自の視点から新たな発想や比喩なども加えて、全く別のコンテンツ(ポッドキャスト番組)を生み出している。特に感心するのは、今回の選挙の特徴をこのAIが見抜いて、それを会話の冒頭で端的に指摘していることだ。その特徴とは、衆議院の解散から投票日まで18日間という異例の短期間で選挙が実施されることだ。これをポッドキャストでは「super short decisive battle」と表現しているが、まさしくこの点こそが最初に強調されるべきことを、このAIは正しく理解しているのである。

次ページは：記事の行間を読み解く力も

1/5ページ

Yahoo!ニュース

グーグルの「会話生成AI」が超リアルでヤバい…これはChatGPTの登場時に匹敵する「衝撃」だ！

本物の人間と区別がつかない！

超リアルな会話と驚愕の理解力

【関連記事】

アクセスランキング（IT総合）

雑誌アクセスランキング（IT・科学）