Infrastruttura· AWS ML· 17 giu 2026· 4 ore fa· 1 lettura minima

Introduzione della cache di container in Amazon SageMaker AI per una scalabilità più rapida

Oggi, siamo entusiasti di annunciare la cache di immagini di container per l'inferenza di Amazon SageMaker AI, il prossimo grande passo avanti nel nostro viaggio di ottimizzazione della scalabilità più rapida. Questo riduce la latenza end-to-end di fino al 2x per genera…

Perché è importante

L’offerta di elaborazione, l’energia e la capacità dei data center determinano quanto a buon mercato può funzionare l’intelligenza artificiale. I cambiamenti infrastrutturali si manifestano nei costi di inferenza settimane dopo.