오늘, 우리는 Amazon SageMaker AI 인터프레이션의 컨테이너 이미지 캐싱을 발표하자고 기쁩니다. 이는 더 빠른 확장 최적화 여정에서의 다음 주요 진보입니다. 이는 종료부터 시작까지의 지연을 최대 2배로 줄입니다.
컴퓨팅 공급, 에너지 및 데이터 센터 용량은 AI를 얼마나 저렴하게 실행할 수 있는지를 결정합니다. 인프라 변화는 몇 주 후에 추론 비용에 나타납니다.
요약은 정보 제공 목적으로만 집계되었습니다. 전체 내용을 보려면 소스 링크를 따르세요. 데모 항목은 예시입니다.