Fornecimento de computação, GPUs, data centers e energia – a camada física que decide o custo de execução da IA.
Histórias 28
O fornecimento de computação, a energia e a capacidade do data center decidem o quão barato a IA pode funcionar. As mudanças na infraestrutura aparecem nos custos de inferência semanas depois.
Mesmo data centers de tamanho moderado podem ter um impacto local descomunal.
A OpenAI está negociando o aluguel de um data center planejado de 10 gigawatts em Ohio que poderia ser apoiado financeiramente pela Nvidia, de acordo com The Information. O artigo OpenAI quer seu maior data center até agora, e a Nvidia seria…
Com capacidade inicial de 24 megawatts, o inovador data center utiliza água do mar como sistema de resfriamento natural.
Um novo relatório da OpenAI detalha as operações de influência ligadas à RPC usando IA para atingir debates tecnológicos nos EUA, narrativas de data centers, tarifas e falsas alegações sobre ChatGPT.
A instalação de 168 megawatts apoiará as necessidades globais de computação de IA da Meta e poderá ser expandida ao longo do tempo.
As GPUs NVIDIA com computação confidencial agora são usadas para inferência confidencial na computação em nuvem privada (PCC) da Apple, à medida que ela se expande além dos data centers da Apple para o Google Cloud. Revelado durante o encontro anual WWDC da Apple…
Num evento hoje em São Francisco, a General Motors fez uma série de anúncios sobre baterias EV, armazenamento de energia e resiliência da rede face à crescente procura de electricidade dos centros de dados de IA. A montadora e…
Nesta postagem, mostramos como treinar políticas de robô para o humanóide Unitree H1 com NVIDIA Isaac Lab no Amazon SageMaker AI em duas opções de computação: Amazon SageMaker HyperPod e Amazon SageMaker Training Jobs.
Na terça-feira, o Conselho Municipal de Seattle votará sobre a possibilidade de promulgar uma moratória de um ano sobre novos data centers – apenas dois meses depois de várias empresas terem proposto a construção de cinco centros de grande escala na cidade. Entre os mo…
Como o Notion usa o Codex para especificações únicas, cria entrada de voz de IA para a web e multiplica o poder de engenharia em pequenas equipes.
Neste tutorial, implementamos um fluxo de trabalho prático para NVIDIA cuTile Python, uma interface de programação de GPU baseada em blocos para kernels estilo CUDA em Python. Preparamos um ambiente amigável ao Colab e verificamos GPU, driver, CUDA,…
O Google encomendou mais de três milhões de chips de IA da Intel para 2028. A Nvidia está testando a tecnologia de fabricação da Intel para sua próxima arquitetura Feynman. Ambos os movimentos ocorrem porque a TSMC não consegue acompanhar a demanda de chips de IA. Internacional…
A equipe MiMo da Xiaomi, com TileRT, lançou o MiMo-V2.5-Pro-UltraSpeed, um modo de serviço para o modelo MiMo-V2.5-Pro. Ele decodifica mais de 1.000 tokens por segundo em um modelo de 1 trilhão de parâmetros usando um único nó de commodity de 8 GPU.…
Com acesso aos mais recentes modelos de IA generativa e computação acelerada de alto desempenho em alta demanda global, os clientes da AWS precisam de ferramentas para aproveitar a disponibilidade e a capacidade do modelo em diversas regiões da AWS, com…
A NVIDIA e o Grupo LG estão construindo uma fábrica de IA para acelerar a próxima onda de negócios orientados por IA do Grupo LG, abrangendo robótica, direção autônoma, tecnologias de data center e serviços de GPU em nuvem. A fábrica de IA irá fornecer…
Clive Chan, segundo seu próprio relato, o segundo funcionário de hardware no programa de chips personalizados da OpenAI, está se mudando para a Anthropic. Ele traz experiência do Autopilot ASIC da Tesla e da parceria OpenAI-Broadcom. A mudança vem um…
O Google lançou o Colab CLI, permitindo que desenvolvedores e agentes de IA executem código local em GPU Colab remoto e tempo de execução TPU The post O novo Colab CLI do Google permite que desenvolvedores e agentes de IA executem Python em GPUs e TPUs Colab remotos F…
Sakana AI has launched a dedicated research lab for recursive self-improvement: AI that iteratively improves itself. The Japanese startup, co-founded by Transformer co-author Llion Jones, sees RSI as an alternative to t…
Developer felt "beaten up," with "no choice" but to shrink data center.
NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Meta may have found one way to slash its massive data center bill: tents.
Kevin O'Leary agreed to halve the size of his planned 40,000-acre data center in Utah amid mounting pressure from residents and activists, as reported earlier by local affiliate ABC4. The Shark Tank star sent a letter t…
The California startup released the fourth-generation of its home assistance robot, Stretch.
Hyperscalers have come under scrutiny for their impact on water quality and availability.
Fresh data-center capacity in several regions eased GPU availability, helping push regional inference cost indices lower this week.
More providers are tying compute prices to local energy conditions, adding a time-of-day dimension to where and when AI workloads run cheapest.
The NVIDIA AI Cloud ecosystem is accelerating the global buildout of AI factory infrastructure. Partners are expanding capacity to meet growing demand from enterprises, startups, nations, AI labs and developers scaling…
Anthropic released Cowork on Monday, a new AI agent capability that extends the power of its wildly successful Claude Code tool to non-technical users — and according to company insiders, the team built the entire featu…
Os resumos são agregados apenas para fins informativos – siga o link da fonte para ver a história completa. As entradas de demonstração são ilustrativas.