NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Tính toán nguồn cung, năng lượng và công suất của trung tâm dữ liệu quyết định AI có thể vận hành với chi phí rẻ như thế nào. Sự thay đổi cơ sở hạ tầng xuất hiện trong chi phí suy luận vài tuần sau đó.
Các bản tóm tắt chỉ được tổng hợp để cung cấp thông tin - hãy nhấp vào liên kết nguồn để xem toàn bộ câu chuyện. Các mục demo có tính minh họa.