NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
El suministro de computación, la energía y la capacidad de los centros de datos deciden qué tan barato puede funcionar la IA. Los cambios en la infraestructura aparecen en los costos de inferencia semanas después.
Los resúmenes se agregan únicamente con fines informativos; siga el enlace fuente para ver la historia completa. Las entradas de demostración son ilustrativas.