「普通すぎる歌しか詠めなかったAI」に、俵万智さんの歌を学習させた「驚きの結果」
俵さんにあって「擬似短歌」にない語彙
ここで、俵さんのデータにのみ含まれる「語彙」を見ていきたいと思います。俵さんのデータが含む言葉の中から、先ほどの「擬似短歌」コーパスには一度も登場しなかったものを数えてみました。その数は3750にもおよび、次のようなものでした。 ---------- ・噓 ・はりまや橋 ・冴えわたる ・アンチョビ ・エアメール ・パンプス ・いっせいに ・湯豆腐 ・心地よく ・ヤツ ・ちりばめ ・軽し ---------- このことから、言語モデルが擬似短歌の学習中には見なかった「語彙」を俵さんのデータの中で見出した、と考えることができます。「こんな言葉を短歌に使っていいんだ」「こんな言葉は知らなかった」といったことは、実際に人が短歌を読んでいてもよくあることです。きっとそれと同じことが、言語モデルの学習過程でも起きているのか、と想像します。 また、俵さんの歌と擬似短歌コーパスの両方に共通して登場する言葉でも、その使われ方はかなり異なることがわかります。次に示すのは、俵さんの歌と擬似短歌のそれぞれで「音楽」を含む例です。 ---------- 俵さんの短歌 吹雪ふぶき枯れ木を揺さぶる音楽は世界の記憶、未来の予感 泣くという音楽があるみどりごをギターのように今日も抱えて ---------- ---------- 擬似短歌 日本の音楽文化発展に寄与することを目的とする アメリカの小学校の音楽の教科書に載り、幼稚園でも ---------- 同じ「音楽」という言葉でも、それが「世界の記憶」と結びついたり、「泣くという音楽」と表されたり、「語彙」だけではないその「組み合わせ」も、普通のテキストと短歌では大きく違うものがあり、それが歌をつくっているのではないでしょうか。こういった表現に触れられるのも、実際の短歌を読み込んでいくほかにはできない経験と言えるでしょう。 実際、短歌が上達するためには、たくさんの作品に触れた方が良いと言われます。好きな作品に出会ったり、意外な言葉の使い方に驚いたり、これまでに詠われた短歌で実践された表現に触れ、それを感じることが、自分の作に影響を与えるということがあるでしょう。
浦川 通