Aujourd'hui, nous annonçons le soutien aux charges utiles inline pour Amazon SageMaker AI Async Inference. Les clients peuvent maintenant envoyer des charges utiles d'inférence directement dans le corps de la requête de l'API InvokeEndpointAsync, éliminant le besoin de télécharger…
Les nouveaux modèles repoussent les limites des capacités et du rapport qualité-prix. Les équipes réévaluent les éléments sur lesquels s'appuyer chaque fois qu'un lancement modifie ce qui est possible par dollar.
Entreprises et modèles mentionnés dans cette histoire — ouvrez leurs pages et prix en direct
Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.