AIに多様性を 国産生成AI開発の意義を開発者に聞く
2022年11月のChatGPT公開以降、AIの話題を目にすることが多くなりました。日本語に特化した国産生成AIを開発している、国立研究開発法人情報通信研究機構(NICT)の鳥澤健太郎フェローにその意義を聞きました。(社会部・内田慧) 【図解】生成AI・大規模言語モデルとは 人材獲得・開発競争は?
~生成AIという技術について~
ChatGPTが公開される以前から、生成AIというものはありました。前身のGPT-3という生成AIも2020年に公開されて、それが賢いので研究者は皆、驚いていたわけです。ただ、法的な問題がありますし、類似のサービスには公開された途端、ヘイトスピーチ的なものを出力して、サービス停止に追い込まれたという事例もあり、リスクが高い技術だなというふうに思っていました。 私たちも当時、WEB情報を使って音声で対話をするシステムを作っていたのですが、開発の初期段階では結構きわどいことを言ったりすることもあったりして、いろんなリスクは実感しており、生成AIを作っても国内企業は使ってくれないだろうというふうに思っていたわけです。 さらには、当時は、ヘイトスピーチみたいなものを100%出ないように工夫することができるかどうかはわからなかったので、メジャーな技術になるかわからないと思っていましたが、万が一ブレイクしたら、それなりに追随できるように基礎研究はしていました。
~ChatGPT公開について感じたこと~
これは別の意味でリスクが非常に大きいとみていました。あっという間に1億人と話をしちゃうわけですから、人間の政治家や思想家などの影響力を大きく上回ることもあり得るわけで、悪用されたら大変なことになるわけです。 実際、フリーの生成AIが変なことを言うようにチューニングされて、悪用されているというような報道も最近出ていたと思いますが、そういうこともあるだろうと思っていましたし、日本のことをよく思っていない集団が、生成AIを使って日本社会になにか攻撃を仕掛けてくるということもあるだろうと想像していました。 OpenAIなどは、生成AIのチューニング作業で弁護士や専門家を雇って出力に問題ないか確認していったということも聞いていますが、これも相当大変な作業だろうと思いました。 一方で、生成AIのもたらすメリットというのも当然あるだろうと思っていました。事務作業が楽になるというようなことだけじゃなくて、画期的なアイデアを生成AIが考えるなど、社会を根幹から変えてしまうような大きなイノベーションは起きるだろうなと思っていました。 実際、我々は複数のLLMを組み合わせて斬新なアイデアを出力することを目指したシステムの開発もしていて、その出力で私自身の考え方が変わるといった経験も何度もしています。 ======== ChatGPTのような文章生成AIの頭脳となる大規模言語モデル(LLM)、鳥澤フェローはこの開発を行ってきた。LLMは巨大なニューラルネットワークというソフトウエアである。ニューラルネットワークとは脳を模した計算の仕組みであり、一つ一つは単純な計算しかしないニューロンと呼ばれる脳細胞を模した小さな計算機がたくさん集まったものだと考えていただければ良い。ニューロンは他の多くのニューロンとあらかじめ結ばれた「配線」を介して信号のやり取りをするが、配線ごとに信号の強さを調整する「重み」がついている。この重みのことをパラメーターと呼ぶが、このパラメーターが多ければ多いほど賢くなると言われている。OpenAIのGPT-3のパラメーターは1750億、GPT-4は1兆以上と言われている。 =========