AWS Inferentiaの概要
AWS Inferentiaは機械学習の推論を支援する専用チップです。低コストの従量課金モデルで利用することができ、初期費用がかからないためすぐに導入をすることができます。深層学習ワークロードを加速するために設計された物の中で、最初に設計されたカスタムシリコンです。
クラウドを使っているため、高性能の推論を提供してくれます。
AWS Inferentiaの利点
AWS Inferentiaには以下の利点があげられます。
- 高性能
- 柔軟性
高性能
最大 16 個の Inferentia チップを持つことにより、音声生成などをすることができます。
柔軟性
16ビットや32ビットなどのトレーニング済みモデルを取得しています。
AWS Inferentiaのまとめ
AWS Inferentiaは機械学習の推論をしてくれるシステムです。
参考資料