Habana Labsが学習用のAIプロセッサ「Gaudi」を発表
2019年6月17日、AIプロセッサーを手掛けるHabana Labsは、新製品となる学習用AIプロセッサ「Gaudi」を発表した。
Habana Labsは2018年Q4に推論用のAIプロセッサ「Goya」をリリースしており、今回発表した学習用の「Gaudi」は同社2品種目のAIプロセッサーとなる。
Habana Labsのホワイトペーパーによると、学習用「Gaudi」と推論用「Goya」の仕様上の違いは大きく4つ。
・第2世代の新型「TPC(Tensor Processor Core)」を搭載
・FP32, BF16, INT32, INT16, INT8, UINT32, UINT16, UINT8をサポート
・RDMA over Converged Ethernet(RoCE v2)機能を統合
・HBM2メモリを搭載
Habana Labsによると、「Gaudi」プロセッサをベースにしたトレーニングシステムは、同数の「NVIDIA Tesla V100 GPU」で構築されたシステムよりも最大4倍のスループットを実現。小さいバッチサイズでも高スループットを維持できるため、トレーニングシステムのパフォーマンスをほぼ線形にスケーリング可能で、数百の「Gaudi」プロセッサを用いた大規模システムも構築可能だという。
なお「Gaudi」プロセッサは「Goya」と同じく下記2種類のカードに搭載された形で提供される。100GイーサネットリンクとRoCE機能をサポートするAIプロセッサは業界初だという。
・HL-200 - 8ポートの100GbイーサネットをサポートするPCIeカード
・HL-205 - OCP-OAM仕様に準拠したメザニンカードで、10ポートの100Gbイーサネットまたは20ポートの50Gbイーサネットをサポート
※HLS-1と呼ぶHL-205を8枚、PCIeコネクタと24個の100Gbイーサネットポートを備える「Gaudi」システムと、同システムを複数搭載するための専用ラックも用意される。
※画像は全てHabana Labs Web上のデータ
学習用AIプロセッサ「Gaudi」は2019年後半に早期顧客にサンプル出荷が開始される予定。