2024年振り返り ますますAIが生活に組み込まれてきた 驚きのNotebookML
世界各地で戦争が起き、その模様がテレビ画面を通じてお茶の間に入ってくる日々が続いている。
どうにも落ち着かない感じがするが、今年を振り返ってみると、昨年との大きな違いはAIが私たちの生活にしっかりと組み込まれたことではないだろうか。
「生成AI」(Generative AI)(機械学習モデルによって、コンテンツを生成する技術)や「ChatGPT」(生成Aの代表的なサービスの一つ。大規模言語モデル=LLM=を活用し、テキストデータを生成)はすっかりお馴染みの言葉となった。かねてから使ってきた言葉である「AI」(Artitficial Intelligence)も、「人口知能」と訳すことなく、単に「AI」というだけで、意味が通じる。
次第に生活に組み込まれ
皆さんも、もうすでにだいぶ生成AIを使っていることと思う。
振り返ってみると、そのはるか前の段階として、「履歴情報を使いながら、利用者が選択しそうなアイテムをリストアップする」作業が行われていたことを発見したのは、アマゾンを利用していて、「おすすめリスト」を見た時ではなかったかと思う。
当時は、「よく私が好きなものがわかるなあ」と感心したものだった。「便利だな」とさえ思った。
次の段階として、メールを打つときに「文章やスペルのサジェスチョンが出る」ことを体験した。当初は「うるさいよ」と思ったものだが、今は「助かるよ」に変わった。
筆者がChatGPTをよく使うようになったのは、今年である。きっかけは体調を崩して横たわっていた時だ。自分の体に何が起きているかを知りたくなり、ずばり質問ができるChatGPTに聞いてみた。人間との会話のような答えになるので、「お大事に」と書かれると、慰められた。ほかにもいろいろ聞くようになった。
秋になって、家族が病気になった。病院からの手紙は専門の医療用語でいっぱいだ。ChatGPTでしらみつぶしのように言葉を調べていった。なぜそうなるのか、どうすればいいのかも書かれてあった。
ChatGPTは単に言葉の意味のみではなく、「相談」もできる。例えば「友人関係で悩んでいる。こういうことをされたが、どうしたらいいのか」などにも、それなりの回答が送られている。
同じく今年から、筆者は翻訳サービスの「DeepL」を使うことになった。大量の文書をもとに原稿を書く必要があり、時間的余裕がなかったので、とても評判が良いこのサービスを使ってみたのである。それ以来、長い文章、訳しにくい文章はこのサービスに頼む。適切な訳ではないと思うこともたびたびあるが、PDFをそのまま画面にドラッグするだけで英語から日本語に翻訳されるのは、非常に便利だ。
問題は、「頭を使わなくなった」ことである。これは一体、何を意味するのだろうか。
さて、普段の情報収集でもAI関係の話題を集めていくうちに、いくつか、「ここまで来たのか!」と思わせるテクノロジーがあることがわかってきた。日本でも一部報道されているが、少しここで挙げてみたい。
AIエージェント
私はポッドキャストをよく聞くのだが、「今後、恐れるべきAIは何か?」というトピックを扱った番組があった。AI開発を専門とする英企業「DeepMind」(グーグル傘下に入ったので、今はGoogle DeepMind)によるポッドキャストである。その中で紹介されていたのが、次世代のツールとしての「AIエージェント」だった。
例えば、スマートフォンを開くと、画面にはたくさんのアプリがある。何らかのタスクを実行しようとするとき、それぞれのアプリを開くことになる。しかし、AIエージェントに任せれば、アプリを作動させて利用者がやりたいことを実行してくれる。
もう少し詳しい説明としては、ウェブサイト「GIGAZINE」によると、米大学教授がAIエージェントを「特定の環境について多くのことを学習し、人間からの簡単なプロンプトがいくつか入力されるだけで、その環境内で問題を解決したり、特定のタスクを実行したりできる技術ツール」と定義しているという。
初期のAIエージェントはすでに稼働している(例:ロボット掃除機)ものの、さらに進んだ形で、利用者に代わってタスクを実行するものになってゆく。
「AIエージェントがやってくる(The AI agents are coming)」という記事(フィナンシャル・タイムズ紙、12月11日付)によると、Anthropicというスタートアップ企業がデモでやってみせたのは、PCの利用者の行動を再現するサービス「Computer Use」。誰かがコンピューターを使って、いろいろなサイトから情報を見つけ、それをもとにデジタル書類を埋めてゆく――この作業をコンピューターが独自で行う。つまるところ、オフィスの事務員がすることをそっくりそのままやって見せたのである。
まだ開発中のデモだったが、これがさらに進めば、相当な数の事務員の仕事が危うくなる「かも」しれない。ロボット掃除機のようなことを事務作業に当てはめた形だ。
来年は、さらに進化しそうだ。
ポッドキャストを自動的に作るNotebookML
別のポッドキャストを聞いていて、「え?」と非常に驚いたのが「文章から、ポッドキャスト番組を作る」サービスだ。グーグルのNotebookMLである。
作成されたポッドキャストは二人組のキャスターがしゃべりあう形で、合いの手も入る。言葉に詰まったり、笑ったりも。
筆者も早速、試してみた。
英国の核兵器についての下院の文書をダウンロードし、そのPDFをNotebookMLにドラッグして読み込ませてみた。数分待つと・・・確かに、二人組のポッドキャストができた。今は英語版のみだそうだ。
文章を読むよりも、音声で聞いた方がわかりやすく、かつ、「二人の会話」の形だともっと聞きやすい。
・・・となると、「文章を読む」という頭脳の能力までゆくゆくは弱体化していくのだろうか?
(AIテクノロジーの話、続きます。)