中国Alibaba、論理的推論重視のAIモデル「QwQ-32B-Preview」リリース
中国Alibabaは11月28日(現地時間)、論理的推論と問題解決能力に重点を置いた新しいAIモデル「QwQ-32B-Preview」(以下「QwQ」)をリリースしたと発表した。 GPQA、AIME、MATH-500、LiveCodeBenchでのベンチマーク結果比較(画像:Qwen) AlibabaのAIチームQwenによると、この言語モデルには325億のパラメータが含まれており、最大3万2000語の文脈を処理できるという。一部のベンチマークテストでは米OpenAIのハイエンドモデル「GPT-4o」などを上回るパフォーマンスを示した。 OpenAIの「o1-preview」と同様に、自己検証システムが組み込まれている。回答を事前に計画し、作業を二重にチェックするこのプロセスで、一般的な言語モデルより精度が向上するとしている。 QwQはApache 2.0ライセンスの下でリリースされたので、商用利用が可能だ。ただし、リリースされているのは特定のコンポーネントのみだ。デモはHugging Faceで入手できる。
ITmedia NEWS