生成AIは「鉄腕アトム」になれるのか? 東大・東工大教授が語るAI研究の最先端
急速に進化を続ける生成AI。データサイエンティストやその周辺領域には、どのような変化が起きようとしているのだろうか。 データサイエンティスト協会は、「10thシンポジウム~データサイエンスの最前線~」を開催。基調講演では、東京工業大学情報理工学院の岡崎直観氏、東京大学AIセンターの松原仁氏、中央大学理工学部教授の樋口知之氏(モデレーター)の3名が登壇し、生成AIの仕組みや将来展望について語った。
ロゴデザインにJSON作成……生成AIはここまで進化した
生成AIと聞いてまず思い浮かぶのは、流行りの画像生成AIかもしれない。
上図は、東京医科歯科大学と東京工業大学が統合にあたって、新大学のロゴをChatGPTに考えてもらった例だ。「医学と工学の両方の要素を取り入れることで、2つの大学の合併を表現しました」とある通り、医療・ゲノム・歯車などのモチーフがちりばめられている。
「もう少しシンプルなデザインのロゴも作成してください」と頼むと、このように両方の要素を加えつつ、洗練されたデザインを提案してくれる。
また、言語モデルの発展も目覚ましい。上図は「日本語の文を英語に翻訳し、対訳コーパス(多言語間の文が対訳の形でまとめられた言語資料)をJSON形式で作成してください」と指示したものだ。 JSON形式(JavaScriptのデータの記述方式)は本来Excelのワークシートなどで作られることが多いが、エンジニアに依頼せずとも、形式を指定することでAIに出力させることが可能になっている。
簡単に言うと、言語モデルとは 「Lemonがヒットした日本人アーティストは『○○』」のように、文章の次にくる単語を予測するという仕組みだという。 まず、文章を「lemon/が/ヒット/した/日本人/アーティスト/は」と単語列に区切り、条件付き確率のモデルに当てはめる。予測したい単語をyとし、日本語の全ての単語をyに入れていって、その確率が一番高いものを回答とする。この場合は「米津玄師」の確率が最も高いということだ。 ここには、確率や統計上の問題だけでなく、言語を扱うことの難しさがあると岡崎氏は語る。「記号と意味をどう対応づけるか」は、昔から注目されていた問題だという。 ■ 曖昧性問題 まず、曖昧性の問題。「記号(単語)」が表現しうる「実体や概念」が複数あるということだ。この場合、「lemon」とは曲を指すのか? 食べ物を指すのか? 「アーティスト」とは画家なのか? 歌手なのか? ということを、文脈から区別する必要がある。 ■ 類義語(多様性)問題