今日、Amazon SageMaker AI推論のためのコンテナイメージキャッシングを発表し、より迅速なスケーリング最適化の次の大きな進展を発表しました。これにより、エンドツーエンドの遅延が最大2倍高速化されます。
コンピューティングの供給、エネルギー、データセンターの容量によって、AI をいかに安価に実行できるかが決まります。インフラストラクチャの変化は数週間後に推論コストに現れます。
概要は情報提供のみを目的としてまとめられています。全文についてはソース リンクを参照してください。デモのエントリは一例です。