IntelのミッドレンジFPGA向けに最適化されたOmnitekのディープラーニング・コア
2019年4月16日、すでに買収によりIntelの傘下となっているOmnitekは、IntelのFPGA向けのディープラーニング・コアを発表した。
DPU(Deep Learning Processing Unit)と呼ばれるOmnitekのディープラーニング・コアは、IntelのミッドレンジFPGA「Arria 10 GX」に最適化されており、「Arria 10 GX 1150」でCNNモデル「VGG-16」を実行した場合、FP32精度で135 GOPS/Wを達成。Omnitekは、このワット当たりの処理性能をミッドレンジのプログラマブル・デバイスとして世界トップクラスとしている。また、同コアは低精度で演算した後に精度を回復するための再トレーニングを行うという、固定小数点演算と浮動小数点演算を組み合わせたアプローチをとる事で、精度を損なう事なく非常に高い演算密度を達成できるという。
OmnitekのDPUはIntelのFPGA「Stratix 10 GX」にも拡張可能なプログラマブルなコアで、TensorFlowをサポートしており、C/C++またはPythonでプログラム可能。GoogLeNet, ResNet-50, VGG-16といった標準的なCNNモデルと同様に独自のカスタムモデルも実装可能で、特にFPGA設計の専門知識は必要ない。(※RNN, MLPなどには今後対応予定。フレームワークとしてはCaffeもサポートされる予定。)
Omnitekによると、DPUは英オックスフォード大学との共同研究プログラムから生まれた技術を応用して開発されたもので、ビデオやイメージング分野のAI対応アプリケーションのコスト削減に特に力を発揮。DPUを補完する各種ライブラリも豊富に用意されているとの事。
OmnitekはこれまでXilinxのFPGA向けに各種コアを開発していたが、先日Intelによる買収が発表された。※関連ニュース