OpenAIの特許を分析する(1)
OpenAI(OpenAI, Inc.)は、AIで社会に貢献することを目的とした非営利組織であり、特許による技術の独占は行わないことがポリシーと思っていましたが、生成AI技術の重要性と経済的価値の高まりにより、そう綺麗事も言ってられなくなったようで、OpenAI OpCo LLCという営利目的子会社を通じて機械学習や生成AIに関連した特許出願を行い、権利化を進めています。本記事執筆時点で確認できるものは、以下の8件(うち、6件は特許登録済)です。
US11886826B1 ”Systems and methods for language model-based text insertion”
US11887367B1 ”Using machine learning to train and use a model to perform automatic interface actions based on video and input datasets”
US11922144B1 "Schema-based integration of external APIs with natural language applications"
US11922550B1 ”Systems and methods for hierarchical text-conditional image generation”
US11983488B1 "Systems and methods for language model-based text editing"
US11983806B1 ”Systems and methods for image generation with machine learning models”
US2024/0020096A1 ”Systems and methods for generating code using language models trained on computer code”
US2024/0020116A1 "Systems and Methods For Generating Natural Language Using Language Models Trained On Computer Code"
この4カ月の間に6件という結構なペースで特許化されていますし、優先審査(Track One)を使って出願公開前に特許登録されていますので、今後も、出願公開前にいきなり特許登録された状態で公開されるケースが続くのではと思います。
さて、この記事では、第1弾として、US11886826B1 ”Systems and methods for language model-based text insertion”(言語モデルベースのテキスト挿入のシステムと方法)の内容について紹介します。出願日は、2023年3月14日、登録日は2024年1月30日です。前述のとおり、優先審査(Track One)の請求により短期間で特許査定になり出願公開(出願日より1.5年)を待つことなく権利化されています(なお、細かい話ですが米国の特許番号でB1が末尾についているのは公開公報が発行される前に特許化されて特許公報が出たケースです、そうでない場合はB2が末尾に付きます)。
この出願の子出願は、PCT/US2023/75857として国際出願もされていますので、今後、米国外でも権利化されていく可能性はあります。(なお、出願日(最先優先日)から1.5年経っていないので国際出願の内容は現時点では未公開です)。
一般に、AI関連の特許というとAIモデルの仕組みそのものの特許とAIを使ったシステムの特許に大きく分かれます。生成AIの分野での前者の代表格としては、LLMの基本技術であるTransformerに関するGoogleの特許などがあります(デコーダーのみの構成も特許化(US11556786)されていますので、GPTに対して権利行使できるのではないかという非常に興味深い論点がありますが、こちらはまた別の機会に解説することにします)。今回解説するOpenAIの特許も、生成AIの内部構造そのものではないですが、ChatGPTの内部アーキテクチャに関する特許です。単に人間の手作業に代えて生成AIを使って何かやりましたというタイプの特許ではありません。
要約の内容等を見る限り、めちゃくちゃ範囲が広そうですが、実際には審査過程でクレームにはかなりの限定がかかっています。権利範囲と審査過程の細かい話とは有料パートにさせていただいていますが、無料パートでも簡単に発明のポイントを述べます。
システム実施例の構成図は以下のとおりです。LLMの中身そのものはブラックボックスとして触れられていませんが、その周辺にある機能群を特許の対象にしています。これにより、実現されるユースケースの例をタイトル画像に示しています。ユーザーとの対話で文書を埋めていくということで、ChatGPTの挙動そのままです(なお、この図は実施例の説明であって、特許の権利範囲とは直接的には関係ありません)。
明細書にはChatGPTという言葉はひと言も出てこないですが、おそらくはこのシステム構成図がChatGPTの内部構造に近いのでしょう。要するに、ChatGPTのクローンのようなシステムを作ると(LLMとしては全然別のものを使っていても)この特許権を侵害するリスクが生じ得るということになります(とは言え、前述のとおり、クレームはかなり限定がかかっていますので最初からわかっていれば回避は容易と思われます)。
特許のポイントの1つは、ユーザーのプロンプトをベースにして場所、人、時刻、事象の少なくとも1つを含む「コンテキストパラメーター」を生成して、LLMへの入力とすることです。ChatGPTで精度の高いアウトプットを得るために、たとえば、「企業のマーケッティング担当者になって回答してください」等々をプロンプトとして入力するテクニックがありますが、あれです。上のシステム構成図で言うとCotext Analysis Engine 108がコンテキストパラメーターの生成とセッション内での維持を司るようになっています。
もう1つのポイントは生成過程でLLMの最適化ステップ(ファインチューニングのようなもの)が実行されることです。これは、上図のLM Optimization Engine 116 により実行される処理で、進歩性維持のために審査段階で限定された要素になります。
クレーム1の内容は以下の通りです。
この記事は有料です。
栗原潔のIT特許分析レポートのバックナンバーをお申し込みください。
栗原潔のIT特許分析レポートのバックナンバー 2024年5月
税込880円(記事1本)
2024年5月号の有料記事一覧
※すでに購入済みの方はログインしてください。