生成AIは「鉄腕アトム」になれるのか？東大・東工大教授が語るAI研究の最先端

1/11(木) 8:46配信

（左から）パネリストの岡崎直観氏（東京工業大学情報理工学院）、松原仁氏（東京大学次世代知能科学研究センター教授）、モデレーターの樋口知之氏（中央大学理工学部教授）

急速に進化を続ける生成AI。データサイエンティストやその周辺領域には、どのような変化が起きようとしているのだろうか。データサイエンティスト協会は、「10thシンポジウム～データサイエンスの最前線～」を開催。基調講演では、東京工業大学情報理工学院の岡崎直観氏、東京大学AIセンターの松原仁氏、中央大学理工学部教授の樋口知之氏（モデレーター）の3名が登壇し、生成AIの仕組みや将来展望について語った。　

ロゴデザインにJSON作成……生成AIはここまで進化した

「東京医科歯科大学と東京工業大学が統合した『東京科学大学』のロゴを描いてください」というプロンプトを入力した例

生成AIと聞いてまず思い浮かぶのは、流行りの画像生成AIかもしれない。

「もう少しシンプルに」と修正を依頼すると……。

上図は、東京医科歯科大学と東京工業大学が統合にあたって、新大学のロゴをChatGPTに考えてもらった例だ。「医学と工学の両方の要素を取り入れることで、2つの大学の合併を表現しました」とある通り、医療・ゲノム・歯車などのモチーフがちりばめられている。

「日本語を英語に翻訳し、対訳コーパスをJSON形式で作成してください」というプロンプトを入力した例

「もう少しシンプルなデザインのロゴも作成してください」と頼むと、このように両方の要素を加えつつ、洗練されたデザインを提案してくれる。

また、言語モデルの発展も目覚ましい。上図は「日本語の文を英語に翻訳し、対訳コーパス（多言語間の文が対訳の形でまとめられた言語資料）をJSON形式で作成してください」と指示したものだ。 JSON形式（JavaScriptのデータの記述方式）は本来Excelのワークシートなどで作られることが多いが、エンジニアに依頼せずとも、形式を指定することでAIに出力させることが可能になっている。　

LLM（大規模言語モデル）の基本的な仕組みは「次単語予測」

言語モデル𝑃による次単語予測

今回岡崎氏が講演のテーマとしたのは、「言語モデルが質問に答える仕組み」だ。

簡単に言うと、言語モデルとは「Lemonがヒットした日本人アーティストは『○○』」のように、文章の次にくる単語を予測するという仕組みだという。まず、文章を「lemon/が/ヒット/した/日本人/アーティスト/は」と単語列に区切り、条件付き確率のモデルに当てはめる。予測したい単語をyとし、日本語の全ての単語をyに入れていって、その確率が一番高いものを回答とする。この場合は「米津玄師」の確率が最も高いということだ。ここには、確率や統計上の問題だけでなく、言語を扱うことの難しさがあると岡崎氏は語る。「記号と意味をどう対応づけるか」は、昔から注目されていた問題だという。 ■ 曖昧性問題まず、曖昧性の問題。「記号（単語）」が表現しうる「実体や概念」が複数あるということだ。この場合、「lemon」とは曲を指すのか？食べ物を指すのか？「アーティスト」とは画家なのか？歌手なのか？ということを、文脈から区別する必要がある。 ■ 類義語（多様性）問題

1/5ページ

Yahoo!ニュース

生成AIは「鉄腕アトム」になれるのか？東大・東工大教授が語るAI研究の最先端

ロゴデザインにJSON作成……生成AIはここまで進化した

LLM（大規模言語モデル）の基本的な仕組みは「次単語予測」

【関連記事】

アクセスランキング（IT総合）

雑誌アクセスランキング（IT・科学）