演算性能と電力効率を両立したCNNアクセラレーター
演算性能と電力効率を両立
ルネサス エレクトロニクス(以下、ルネサス)は2021年2月17日、オンラインで開催された半導体業界最大級の国際学会「ISSCC 2021」(同年2月13~22日)で、車載SoC(System on Chip)向けに高い性能と電力効率を両立したCNN(畳み込みニューラルネットワーク)アクセラレーターコアおよび機能安全技術を発表した。 左=水冷と空冷を分ける25Wを基準に、性能とのベストバランスを追求した/右=高い電力効率を実現したCNNハードウェアアクセラレーター 出典:ルネサス エレクトロニクス(クリックで拡大) CNNアクセラレーターは、60.4TOPSのディープラーニング性能と、13.8TOPS/Wの電力効率を実現したもので、ルネサスは同アクセラレーターを搭載した車載SoC「R-Car V3U」を2020年12月に既に発表している。 ルネサスによると、「水冷と空冷を分ける消費電力のポイントが25W。そこより高いと水冷になるのでシステムのコストが上がってしまうが、低くし過ぎると今度はディープラーニングの性能が下がってしまう。今回のCNN IP(Intellectual Property)は性能と消費電力のベストバランスを探した」という。 CNNアクセラレーターの技術的な特長は主に3つある。1)1コア当たり1万3824個の積和演算器を搭載したこと、2)CNNアクセラレーターの専用メモリを設けたこと、3)CNN処理の外付けDRAMとの転送データ量を9割以上削減したことだ。 R-Car V3Uは、このCNNハードウェアアクセラレーターコアを3個実装したことで、60.4TOPSの性能を実現している。さらに、各アクセラレーターコアに対して2Mバイトの専用メモリ(合計6Mバイト)を搭載し、広帯域のバスでアクセラレーターコアと直接接続した。専用メモリを搭載したことで、CNNと外付けDRAMのデータ転送量を9割以上削減できたという。「外付けDRAMとのデータ転送が、消費電力の大きな割合を占める。そこを削減したことが、優れた電力効率の鍵となった」(ルネサス)