Suministro de computación, GPU, centros de datos y energía: la capa física que decide qué tan barato funciona la IA.
historias 28
El suministro de computación, la energía y la capacidad de los centros de datos deciden qué tan barato puede funcionar la IA. Los cambios en la infraestructura aparecen en los costos de inferencia semanas después.
Incluso los centros de datos de tamaño moderado pueden tener un impacto local enorme.
OpenAI está negociando el arrendamiento de un centro de datos planificado de 10 gigavatios en Ohio que podría contar con el respaldo financiero de Nvidia, según The Information. El artículo OpenAI quiere su centro de datos más grande hasta el momento, y Nvidia sería...
Con una capacidad inicial de 24 megavatios, el innovador centro de datos utiliza agua de mar como sistema de refrigeración natural.
Un nuevo informe de OpenAI detalla las operaciones de influencia vinculadas a la República Popular China que utilizan IA para atacar los debates tecnológicos, las narrativas de los centros de datos, los aranceles y las afirmaciones falsas sobre ChatGPT de EE. UU.
La instalación de 168 megavatios respaldará las necesidades globales de computación de IA de Meta y puede ampliarse con el tiempo.
Las GPU NVIDIA con Confidential Computing ahora se utilizan para inferencias confidenciales en Private Cloud Compute (PCC) de Apple, a medida que se expande más allá de los centros de datos de Apple hacia Google Cloud. Revelado durante la reunión anual WWDC de Apple...
En un evento celebrado hoy en San Francisco, General Motors hizo una serie de anuncios sobre las baterías de los vehículos eléctricos, el almacenamiento de energía y la resiliencia de la red frente a la creciente demanda de electricidad de los centros de datos de IA. El fabricante de automóviles y…
En esta publicación, mostramos cómo entrenar políticas de robot para el humanoide Unitree H1 con NVIDIA Isaac Lab en Amazon SageMaker AI a través de dos opciones informáticas: Amazon SageMaker HyperPod y Amazon SageMaker Training Jobs.
El martes, el Ayuntamiento de Seattle votará sobre la promulgación de una moratoria de un año sobre los nuevos centros de datos, sólo dos meses después de que varias empresas propusieran construir cinco centros a gran escala en la ciudad. Entre los mo…
Cómo utiliza Notion Codex para especificaciones únicas, crear entrada de voz AI para la web y multiplicar el poder de ingeniería en equipos pequeños.
En este tutorial, implementamos un flujo de trabajo práctico para NVIDIA cuTile Python, una interfaz de programación de GPU basada en mosaicos para núcleos estilo CUDA en Python. Preparamos un entorno compatible con Colab y comprobamos GPU, controlador, CUDA,…
Google ha encargado más de tres millones de chips de IA a Intel para 2028. Nvidia está probando la tecnología de fabricación de Intel para su próxima arquitectura Feynman. Ambos movimientos se producen cuando TSMC no puede satisfacer la demanda de chips de IA. Int…
El equipo MiMo de Xiaomi, con TileRT, lanzó MiMo-V2.5-Pro-UltraSpeed, un modo de servicio para el modelo MiMo-V2.5-Pro. Decodifica más de 1000 tokens por segundo en un modelo de 1 billón de parámetros utilizando un único nodo básico de 8 GPU.…
Con acceso a los últimos modelos de IA generativa y computación acelerada de alto rendimiento en alta demanda global, los clientes de AWS necesitan herramientas para aprovechar la disponibilidad y la capacidad del modelo en múltiples regiones de AWS, w…
NVIDIA y LG Group están construyendo una fábrica de IA para acelerar la próxima ola de negocios impulsados por IA del Grupo LG, que abarca robótica, conducción autónoma, tecnologías de centros de datos y servicios de nube GPU. La fábrica de IA demostrará…
Clive Chan, según él mismo el segundo empleado de hardware en el programa de chip personalizado de OpenAI, se mudará a Anthropic. Aporta experiencia del Autopilot ASIC de Tesla y la asociación OpenAI-Broadcom. La medida surge un…
Google lanzó Colab CLI, lo que permite a los desarrolladores y agentes de IA ejecutar código local en el tiempo de ejecución remoto de Colab GPU y TPU La publicación La nueva Colab CLI de Google permite a los desarrolladores y agentes de IA ejecutar Python en GPU y TPU de Colab remotos F...
Sakana AI has launched a dedicated research lab for recursive self-improvement: AI that iteratively improves itself. The Japanese startup, co-founded by Transformer co-author Llion Jones, sees RSI as an alternative to t…
Developer felt "beaten up," with "no choice" but to shrink data center.
NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Meta may have found one way to slash its massive data center bill: tents.
Kevin O'Leary agreed to halve the size of his planned 40,000-acre data center in Utah amid mounting pressure from residents and activists, as reported earlier by local affiliate ABC4. The Shark Tank star sent a letter t…
The California startup released the fourth-generation of its home assistance robot, Stretch.
Hyperscalers have come under scrutiny for their impact on water quality and availability.
Fresh data-center capacity in several regions eased GPU availability, helping push regional inference cost indices lower this week.
More providers are tying compute prices to local energy conditions, adding a time-of-day dimension to where and when AI workloads run cheapest.
The NVIDIA AI Cloud ecosystem is accelerating the global buildout of AI factory infrastructure. Partners are expanding capacity to meet growing demand from enterprises, startups, nations, AI labs and developers scaling…
Anthropic released Cowork on Monday, a new AI agent capability that extends the power of its wildly successful Claude Code tool to non-technical users — and according to company insiders, the team built the entire featu…
Los resúmenes se agregan únicamente con fines informativos; siga el enlace fuente para ver la historia completa. Las entradas de demostración son ilustrativas.