Intel、高性能版Xeon 6やGaudi 3を正式発表。生成AI向け製品群を拡充
Intelは9月24日(現地時間)、Granite Rapidsのコードネームで開発してきた次世代データセンター向けCPUを「P-core搭載インテルXeon 6プロセッサー」(以下P-core搭載Xeon 6)として発表した。 【画像】Gaudi 3 同社は、Xeon 6ファミリの最初の製品として、COMPUTEX 2024において開発コードネームSierra Forestこと「E-core搭載インテルXeon 6プロセッサー」(以下E-Core搭載Xeon 6)を既に発表しているが、今回のP-core搭載Xeon 6により、高性能向けと高密度向けの両方の製品が揃ったことになる。 また、Intelは技術的な概要を既に公開していた、AIアクセラレータの「インテル Gaudi 3 AI アクセラレーター」(以下Gaudi 3)を正式に発表した。 ■ Granite RapidsことP-core搭載Xeon 6が正式に発表される、最大128コア、MRDIMMやCXL 2.0に対応 Intelは、6月のCOMPUTEX 2024において、Xeon 6の最初の製品となるE-Core搭載Xeon 6を発表し、出荷開始している。電力効率に優れたEコアだけから構成されているXeonで、ラックあたりに集約できるCPU数をできるだけ増やしたいユーザー向けの製品となり、1ソケットで144コアを実現した製品となっている。なお、Sierra Forestには288コア版も用意されているが、そちらは来年(2025年)の第1四半期の投入が計画されている。 今回発表されたのはPコアだけで構成されるP-core搭載Xeon 6で、これまで開発コードネームGranite Rapidsで知られてきた。CPUには、Core Ultra シリーズ1(Meteor Lake)で採用されているRedwood Coveコアを採用しており、最大で3つのCPUダイと2つのIOダイというチップレット構造を採用しているのが特徴となる。 型番としては6900Pシリーズと呼ばれ、3つのCPUダイ(Intel 3で製造)+2つのIOダイ(Intel 7で製造)という最上位構成で、CPUコアは最大128コア構成までが可能になっている。CPUコア数が増えたことで、キャッシュサイズも増大しており、CPUソケットあたり最大で504MBのL3キャッシュが搭載されている。 メモリはDDR5-6400までの対応となるが、複数のランクを1つのモジュール上で利用できるMR(Multiplexed Rank)DIMMに対応しており、最大で1チャンネルあたり8,800MT/sの帯域幅が実現できる。プラットフォームの仕様としては最大12チャンネルまでメモリチャンネルに対応可能になっており、メモリ帯域幅が従来世代よりも大きく引き上げられていることが特徴となっている。 また、CXL 2.0にも対応している。CXLはPCI Expressをベースにし、キャッシュコヒーレンシを実現可能にした規格で、CXL 2.0でサポートされているCXL Memory(Type3)では、メインメモリに加えてCXLを利用したメモリの拡張が可能で、速度よりもメモリ容量の大きさが要求されるSAP HANAのようなインメモリデータベースなどで性能を向上させることができる。 ソフトウェア面では、Intelの拡張命令セットであるAMX(Advanced Matrix eXtensions)命令において、新しくFP16のサポートが追加されている。これにより、AMX命令を利用してFP16の精度を利用した演算が可能になり、AIの学習時や推論時の性能が向上した。 今回発表されたP-core搭載Xeon 6には、128コアを搭載した最上位のXeon 6 6980Pから、72コアを搭載したXeon 6 6960Pまで、5つのSKUが用意されている。 ■ LLaMa 2 70Bの推論でH100に比べて2倍の価格性能比を実現するGaudi 3、Dell、HPE、Supermicroから提供 IntelのGaudiシリーズは、Intelが2019年に買収した「Habana Labs」が開発してきたAIアクセラレータの最新製品で、2022年に発表され、提供が開始されたGaudi 2の後継となる製品だ。 Gaudi 3に関しては既にIntelは技術的な概要を発表しており、その詳細に関しては以下の記事をご参照いただきたい。 Gaudi 3はプロセスノードが7nmから5nmへ微細化され、1つのパッケージに2つのダイを搭載することで、内蔵エンジンを大幅に増やした。具体的には、TPCと呼ばれるベクターエンジンが24から64に、MMEと呼ばれる行列演算エンジンが2から8にと大幅に増やされており、演算性能が大きく引き上げられている。 従来世代がNVIDIAのA100世代に対抗する製品に位置づけられていたが、今回のGaudi 3はNVIDIAのH100に対抗し、LLaMa 2 70Bのモデルを利用した場合、推論時のスループットがNVIDIA H100に比べて2倍の価格性能比を実現するとIntelは説明している。 Gaudi 3を搭載した製品は、第4四半期からDell Technologies、Hewlett Packard Enterprise(HPE)、Supermicroの3社から提供される計画になっている。
PC Watch,笠原 一輝