Cadenceが最大12,000個のMACを搭載する推論アクセラレーター「Tensilica DNA 100」を発表
2018年9月20日、CadenceはAIアプリケーション向けの推論アクセラレーターの新製品「Tensilica DNA 100 Processor IP」を発表した。
新製品「Tensilica DNA 100 Processor IP」は、既存製品「Tensilica® Vision C5 DSP」の後継となる新型の推論アクセラレーターで、演算リソースの中心となるMAC(積和演算器)数は最大12,000個(8-bit x 8-bit)、アプリケーションに必要な演算性能に応じて500?12,000個の間でMAC数の構成を変更することが可能。また、「Tensilica DNA 100」を複数個利用することで数100TMACまで演算性能をスケールアップできる。(「Tensilica® Vision C5 DSP」のMAC数は最大1024個)
Cadenceによると、「Tensilica DNA 100」には「スパース・コンピュート・エンジン」と呼ぶハードウェア・エンジンが搭載されており、ニューラルネットワークのスパース状態を利用して不必要なMACリソースの消費を削減する事が可能。これにより電力効率の向上と演算量の削減を実現できる。Cadenceは同程度のMACアレイサイズを持つ他のソリューションと「Tensilica DNA 100」を比較すると、パフォーマンスで最大4.7倍、1ワットあたりのパフォーマンスで最大2.3倍、「Tensilica DNA 100」の方が優れていると説明。また、4K MAC構成、16nmプロセス実装時のResNet 50のスループット最大2,550fps、電力効率最大3.4TMAC/W という性能指標を紹介している。
なおCadenceによると、「Tensilica DNA 100」は広範なニューラルネットワークとCaffe、TensorFlow、TensorFlow Liteなどのディープラーニング・フレームワーク、ANN (Android Neural Network) APIに対応しており、推論アクセラレーターとしてニューラルネットワークのすべての層を実行することが可能。今後サポートが必要となる新しいニューラルネットワークに対しては内蔵するDSPで対応する。
「Tensilica DNA 100」は、2018年12月に特定顧客向けにリリース。2019年Q1に一般向け販売を開始する予定。