Infrastructure· MarkTechPost· 5 juin 2026· il y a 2 mois· Lecture minimale de 1

NVIDIA AI lance Nemotron 3 Ultra : un transformateur Mamba hybride ouvert d'un mélange d'experts de 550 B pour les agents de longue durée

NVIDIA a publié Nemotron 3 Ultra, un Mamba-Transformer hybride ouvert et mixte d'experts de 550 B au total (55 B actifs) pour les agents de longue durée. Il associe un contexte de 1 million de jetons à un débit d'inférence jusqu'à environ 6 fois supérieur à celui des concurrents.

Pourquoi c'est important

L’approvisionnement informatique, l’énergie et la capacité du centre de données déterminent le coût de fonctionnement de l’IA. Les changements d’infrastructure apparaissent dans les coûts d’inférence des semaines plus tard.

Explorez sur HotON

Entreprises et modèles mentionnés dans cette histoire — ouvrez leurs pages et prix en direct

NVIDIA →

Explorez les données derrière cela

Pages HotON.ai associées

Régions →Index →

Plus de nouvelles

Nouvelles →

Infrastructureil y a 12 heures

Les stocks de puces chutent alors que la vente de l’IA s’intensifie

Infrastructureil y a 15 heures

Les centres de données pourraient être confrontés à des coupures de courant temporaires pour éviter des pannes sur le plus grand réseau américain

Infrastructureil y a 17 heures

Taïwan arrête un employé de Nvidia dans le cadre d'une enquête élargie sur la contrebande de puces en Chine

Infrastructureil y a 17 heures

Vous avez mal utilisé votre batterie externe, et les règles des compagnies aériennes le montrent clairement

Lire l'original (MarkTechPost) →

Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.