Yahoo!ニュース

IDでもっと便利に新規取得

ログイン

Arm、Cortex-A78/Mali-G78/Ethos-N78などを発表 - 次世代モバイル向けIP

配信

マイナビニュース

次世代のプレミアムモバイル向けIPを発表 英Armは5月26日(英国時間)、モバイルデバイス向け新IPとしてCPU「Cortex-A78」、GPU「Mali-G78」、NPU「Ethos-N78」などを発表した。これに先駆け、事前説明会が行われたので、その内容を基にご紹介したい。 【画像】Armの次世代IPによってスマホの性能は従来比で20~25%ほど向上する 本来この発表会は、5月末に開催予定だったCOMPUTEX TAIPEIにあわせて行われる予定だったのだろうが、COMPUTEX TAIPEIそのものが今年は流れそう(5月26日時点では9月28日~30日に開催予定だが、台湾への海外からの入国は10月1日から段階的に解禁という話であり、しかも展示会であるためWebで開催するのもなかなか難しいだろう)とあって、単独での発表となった形だ。 まず今回発表されたのは、2021年のプレミアムモバイル機器向けCPU/GPU/NPUスイートである。 Cortex-A77の後継となるCortex-A78 まずCortex-A78であるが、これは現在のCortex-A77の後継となる製品、以前のロードマップで言う所の「Hercules」に相当するコアである。引き続きCortex-A55と対になる形でbig.LITTLE/DynamIQが構成できるとする。 具体的な性能であるが、コアあたり1Wという同じ消費電力枠で言えば、Cortex-A78は20%ほど高速であり、その一方でエリアサイズは15%ほど節約できるとしている。ちなみにこれはCortex-A55まで含んだ8コアでの構成でのエリアサイズの比較なので、実際にCortex-A78とCortex-A77のエリアサイズを比較すると20%以上の節約になるとみられる。 難しいのは、これがプロセスの微細化も含んで実現されるという点だ。TSMCのN5で言えば、2019年のArm TechConにおける発表では、 同じ消費電力なら15%高速化 同じ動作周波数なら30%省電力化 同じVddで動作周波数25%アップ ロジック密度1.8倍 SRAM密度1.35倍 アナログ部密度1.2倍 とされており、おそらく2.6GHz→3GHzが最初の「同じ消費電力なら15%高速化」の効果である。一方で、ロジック密度は最大1.8倍としつつ、キャッシュなどは1.35倍とされるので、平均すると50%程度の密度向上と見なすべきだろうか? ここから見ると、8コアで15%の節約、というのはおそらく「同じプロセスで製造すると30%以上エリアサイズが増えるが、5nmに移行することで15%節約することに成功した」というあたりではないかと思う。 Mali-G77比で25%の性能改善を果たしたMali-G78 次はMali-G78である。Mali-G77比で25%の性能改善とされている。 Mali-G77が7コアから最大16コアまでの構成なのに対し、Mali-G77は最大24コアまでの構成をサポートする。25%、というのは先ほどのCortex-A78と同じく5nmプロセスを使っての数字であるが、同一プロセスを利用し同一条件でMali-G77と比較して、6%~17%のゲーム性能改善がみられる、としている。 また、AI性能に関しても15%ほど向上としている。 さらにゲーム開発者向けに新しく「Performance Advisor」が提供されることも明らかにされた。 ところでMali-G88はプレミアムモバイル向けGPUだが、その下のグレード向けとして、Mali-G68も同時にアナウンスがあった。こちらは最大6コアまで、という事になっており、1~6コアがMali-G68、7~24コアがMali-G78という使い分けになる模様だ。 前世代比で性能を2倍にしたEthos-N78 3つ目がEthos-N78である。 最大性能で2倍、効率25%アップ、DRAM帯域40%アップといった数字が並んでいる。こちらはさらに細かい情報が出てきていないので推察するしかないのだが、Performance Efficiencyが25%以上向上というのは、内部のコアの動作周波数そのものは据え置きにしており、プロセスの微細化により25%の省電力化が可能になった、という可能性が高い。 DRAM帯域については、これは何かしらアクセスの最適化を図るような仕組みが加わった様にも思えるが、こちらも詳細は不明のままだ。先も書いたように、5nmに移行することでエリアサイズは平均して50%ほど削減できる。その分、コア数をEthos-N77より増やすことは難しくない、という発想ではないかと思われる。 実際、Ethos-N77の世代では最大4TOPsが実現可能だったのが、Ethos-N78では10TOPsが視野に入っているとする。 なおEthos-N78にもPerformance Advisorが提供される様になったそうである。 機能特化型のArmコアのカスタム開発が可能に さて、今回の発表ではOne more thingがあった。それが「Cortex-X Custom Program」である。 ちょっと古い話であるが、2016年にArmはCortex Technology License「Built on ARM Cortex Technology」を発表している。これはLead Licenseを取得しているパートナーのうちの一部に提供されるもので、あくまでも「Armと共同で」内部構造やマイクロコードのカスタマイズを行う事が出来るというものだが、このCortex Technology Licenseを一歩進めたのが今回のCortex-X Cusom Programとなる。 これを利用することで、例えばエリアサイズを犠牲にして性能を大幅に引き上げる、といった事も可能になる。もともとArmはPOP IPを提供する際には割とバランスの取れたPPA Optimizationを施しているが、当然ここで「突き抜けたパフォーマンスが欲しい」といったニーズには対応できない。もちろんPOPを使わずにRTLから物理実装を掛ければ、それなりに偏った構成にも出来るが、さらに性能が欲しいといったニーズに対応できるのがこちらということになる。 そのカスタマイズ版の最初の製品が「Arm Cortex-X1」で、Cortex-A77世代と比較して30%もの性能アップが可能になった、としている。 面白いのはこのCortex-X Custom Programで生成されたコアはCortexブランドを名乗る事が可能で、またDynamIQを構築することも可能、という点だ。 最近で言えば、SamsungがArmコアの自社開発継続を断念してArmの標準プロセッサコアに回帰する(元々両方使っていたため、単に自社でのコア開発を断念、という方が正確か)動きを見せているが、そうなると今度は差別化が難しいという話が出てくる。そうしたニーズに応えるのがこのCortex-X Custom Programということになる。 従来プログラムとCortex-X Custom Programの違いは? ではCortex Technology LicenseとCortex-X Custom Programの違いは? という話になる訳だが、説明によればCortex Technology Licenseの元で可能なカスタマイズは、設計の中で変更可能な比較的小さな領域に留まっており、性能への寄与もそれほど大きくはなかったという。ところがCortex-X Custom Programは、例えばそれが望まれるならNeon Unitの数を倍増させるといった、かなり性能へのインパクトの大きな変更も可能なのだそうだ。つまるところPPA Optimizationの新しいポイントを、顧客とArmで共同で決められるというのが、Cortex-X Custom Programの主眼なのだという。

大原雄介

【関連記事】