Fourniture de calcul, GPU, centres de données et énergie : la couche physique qui décide du fonctionnement à moindre coût de l'IA.
Histoires 28
L’approvisionnement informatique, l’énergie et la capacité du centre de données déterminent le coût de fonctionnement de l’IA. Les changements d’infrastructure apparaissent dans les coûts d’inférence des semaines plus tard.
Même les centres de données de taille moyenne peuvent avoir un impact local démesuré.
OpenAI négocie la location d'un centre de données prévu de 10 gigawatts dans l'Ohio qui pourrait être soutenu financièrement par Nvidia, selon The Information. L'article OpenAI veut son plus grand centre de données à ce jour, et Nvidia serait…
D'une capacité initiale de 24 mégawatts, le centre de données innovant utilise l'eau de mer comme système de refroidissement naturel.
Un nouveau rapport d'OpenAI détaille les opérations d'influence liées à la RPC utilisant l'IA pour cibler les débats technologiques américains, les récits des centres de données, les tarifs et les fausses déclarations sur ChatGPT.
L'installation de 168 mégawatts répondra aux besoins mondiaux en matière de calcul d'IA de Meta et pourra être étendue au fil du temps.
Les GPU NVIDIA avec Confidential Computing sont désormais utilisés pour l’inférence confidentielle dans le Private Cloud Compute (PCC) d’Apple, à mesure qu’il s’étend au-delà des centres de données d’Apple jusqu’à Google Cloud. Dévoilé lors du rassemblement annuel WWDC d’Apple…
Lors d'un événement à San Francisco aujourd'hui, General Motors a fait une série d'annonces concernant les batteries de véhicules électriques, le stockage d'énergie et la résilience du réseau face à la demande croissante d'électricité des centres de données d'IA. Le constructeur automobile et…
Dans cet article, nous montrons comment former des stratégies de robot pour l'humanoïde Unitree H1 avec NVIDIA Isaac Lab sur Amazon SageMaker AI à travers deux options de calcul : Amazon SageMaker HyperPod et Amazon SageMaker Training Jobs.
Comment Notion utilise Codex pour créer des spécifications uniques, créer une entrée vocale IA pour le Web et multiplier la puissance d'ingénierie au sein de petites équipes.
Mardi, le conseil municipal de Seattle votera sur l'opportunité d'adopter un moratoire d'un an sur les nouveaux centres de données - deux mois seulement après que plusieurs entreprises ont proposé de construire cinq centres à grande échelle dans la ville. Parmi les mo…
Dans ce didacticiel, nous implémentons un flux de travail pratique pour NVIDIA cuTile Python, une interface de programmation GPU basée sur des tuiles pour les noyaux de style CUDA en Python. Nous préparons un environnement convivial pour Colab et vérifions le GPU, le pilote, CUDA,…
Google a commandé plus de trois millions de puces IA à Intel pour 2028. Nvidia teste la technologie de fabrication d'Intel pour sa prochaine architecture Feynman. Les deux décisions surviennent alors que TSMC ne peut pas répondre à la demande de puces IA. Int…
L'équipe MiMo de Xiaomi, avec TileRT, a publié MiMo-V2.5-Pro-UltraSpeed, un mode de service pour le modèle MiMo-V2.5-Pro. Il décode plus de 1 000 jetons par seconde sur un modèle de 1 billion de paramètres à l'aide d'un seul nœud de base de 8 GPU.…
Avec l'accès aux derniers modèles d'IA générative et au calcul accéléré hautes performances face à une forte demande mondiale, les clients AWS ont besoin d'outils pour tirer parti de la disponibilité et de la capacité des modèles dans plusieurs régions AWS, avec…
NVIDIA et le groupe LG construisent une usine d'IA pour accélérer la prochaine vague d'activités du groupe LG axées sur l'IA, couvrant la robotique, la conduite autonome, les technologies de centres de données et les services cloud GPU. L’usine IA prouvera…
Clive Chan, selon son propre compte, le deuxième employé matériel du programme de puces personnalisées d'OpenAI, déménage chez Anthropic. Il apporte son expérience de l'ASIC Autopilot de Tesla et du partenariat OpenAI-Broadcom. Le déménagement intervient un…
Google a publié la CLI Colab, permettant aux développeurs et aux agents d'IA d'exécuter du code local sur le runtime GPU et TPU Colab à distance. L'article La nouvelle CLI Colab de Google permet aux développeurs et aux agents d'IA d'exécuter Python sur des GPU et TPU Colab distants F…
Sakana AI has launched a dedicated research lab for recursive self-improvement: AI that iteratively improves itself. The Japanese startup, co-founded by Transformer co-author Llion Jones, sees RSI as an alternative to t…
Developer felt "beaten up," with "no choice" but to shrink data center.
NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Meta may have found one way to slash its massive data center bill: tents.
Kevin O'Leary agreed to halve the size of his planned 40,000-acre data center in Utah amid mounting pressure from residents and activists, as reported earlier by local affiliate ABC4. The Shark Tank star sent a letter t…
The California startup released the fourth-generation of its home assistance robot, Stretch.
Hyperscalers have come under scrutiny for their impact on water quality and availability.
Fresh data-center capacity in several regions eased GPU availability, helping push regional inference cost indices lower this week.
More providers are tying compute prices to local energy conditions, adding a time-of-day dimension to where and when AI workloads run cheapest.
The NVIDIA AI Cloud ecosystem is accelerating the global buildout of AI factory infrastructure. Partners are expanding capacity to meet growing demand from enterprises, startups, nations, AI labs and developers scaling…
Anthropic released Cowork on Monday, a new AI agent capability that extends the power of its wildly successful Claude Code tool to non-technical users — and according to company insiders, the team built the entire featu…
Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.