賞金200万円も、Anthropicがバグバウンティプログラムを開始、AIの安全性を高める取り組み最前線
OpenAIやグーグルのAIバグバウンティプログラム
AI開発の最前線を走るOpenAIとグーグルも、AIに特化したバグバウンティプログラムを展開している。 OpenAIがバグバウンティプログラムを発表したのは2023年4月。BugCrowdと提携し、AIシステムの脆弱性を発見した人に最大2万ドルの報奨金を支払うプログラムだ。現在も進行中で、直近では、2024年8月22日にバグの申請受付がなされている。 一方、グーグルも既存の脆弱性報奨金プログラムを拡大し、生成AIに関連する攻撃シナリオを対象に含めることを決定した。Forbes(2023年10月27日)によると、グーグルは2022年に1,200万ドル以上の報奨金を支払っており、AIに関する脆弱性も同様の枠組みで報奨の対象になる。特にプロンプトインジェクションによる脆弱性発見が推奨されるという。 このほかにもハルシネーションの低減に向けた動きも加速しており、「信頼できる安全なAI」の構築に向け、主要企業間の競争は今後さらに激しくなる見込みだ。
文:細谷元(Livit)