CadenceがプロセッサIPの新製品「Neo NPU」を発表、あらゆるホストプロセッサーから推論処理をオフロード
2023年9月14日、CadenceはプロセッサIPの新製品「Neo NPU」を発表した。
Cadenceの新製品「Neo NPU」は、既存のプロセッサIP「Tensilica」シリーズとは異なる新たな製品で、オンデバイスおよびエッジのAI演算処理に特化したプロセッサIPとしてあらゆるホスト・プロセッサーから推論処理の効率的なオフロードを実現する。
「Neo NPU」の主な特徴は以下の通り。
・シングルコアで最大80TOPSまで、マルチコアで数百TOPSまでパフォーマンスを拡張可能
・サイクル当たり256から32K MACに対応
・Int4、Int8、Int16、FP16のデータタイプに対応
・高いパフォーマンスと効率性:
同社の第一世代 AI IPと比較して最大20倍高速化
IPS/mm2 (1秒間、1mm2当たりの推論性能) は2倍から5倍向上
IPS/W (1秒間、1ワット当たりの推論性能) は5倍から10倍向上
※画像はCadenceホームページ上のデータ
あらゆるホスト・プロセッサーから推論処理を効率的にオフロードするために、「Neo NPU」はニューラルネットワークのパフォーマンスと精度のトレードオフに対して柔軟に対応することが可能。「Tensilica」シリーズのプロセッサ開発にも利用できるソフトウェア開発環境「NeuroWeave SDK」は、スケーラブルで設定変更が可能なソフトウェア・スタックを提供するほか、TensorFlow、ONNX、PyTorch、Caffe2、TensorFlow Lite、MXNet、JAX、その他の業界標準の多くのドメイン固有なMLフレームワークに対応。Android Neural Network Compiler、TF Lite Delegates、TensorFlow Lite Microにも対応している。
Cadenceが新製品「Neo NPU」によって狙うのは、インテリジェントセンサー、IoTおよびモバイルデバイス、カメラ、ヒアラブル/ウェアラブル、PC、AR/VRヘッドセット、ADASなど、広範囲に渡る組込みAI処理で、Arm、Synopsysに次ぐ業界3位のIPベンダとして更なるシェア拡大を目指す。(CadenceのIP市場のシェアは2022年実績で5.4%*、これまで600億個以上のプロセッサIPを出荷している)
*IPnest社の調べ
新製品「Neo NPU」および「NeuroWeave SDK」はすでに先行顧客向けに提供中で2023年12月初旬に一般提供が開始される予定。