Infraestrutura

Infraestrutura de IA

Fornecimento de computação, GPUs, data centers e energia – a camada física que decide o custo de execução da IA.

Histórias 180

Todas as notícias Lançamentos de modelos Preços Infraestrutura Política Financiamento e Fusões e Aquisições Código aberto

Por que isso importa

O fornecimento de computação, a energia e a capacidade do data center decidem o quão barato a IA pode funcionar. As mudanças na infraestrutura aparecem nos custos de inferência semanas depois.

Infraestrutura· NVIDIA· 27 de jul. de 2026· há 10 horas▲

NVIDIA aproveita a CPU Vera para acelerar o design de CPUs e GPUs de próxima geração

A complexidade do design moderno de chips continua a crescer à medida que as equipes de engenharia trabalham para desenvolver CPUs, GPUs e sistemas de IA cada vez mais sofisticados. Para ajudar a enfrentar esse desafio, a NVIDIA está colaborando com o líder do setor…

Infraestrutura· TechCrunch· 27 de jul. de 2026· há 15 horas■

Entendendo o pânico em relação à IA chinesa

No último episódio de Equity, discutimos por que Kimi, da Moonshot AI, parecia entrar em pânico no Vale do Silício e em Wall Street.

Infraestrutura· MarkTechPost· 26 de jul. de 2026· anteontem■

Projetando kernels de GPU de alto desempenho com TileLang: Tensor-Core GEMM, Fused Softmax, FlashAttention e Autotuning

Explore o TileLang, uma linguagem Python específica de domínio de alto nível que simplifica o design de kernels de GPU de alto desempenho. Este tutorial fornece uma abordagem passo a passo para implementar cargas de trabalho complexas, incluindo blocos…

Infraestrutura· TechCrunch· 25 de jul. de 2026· anteontem▲

Uma linha de energia caída expôs um problema crescente no data center de IA. Veja como consertar isso.

Uma situação difícil na Virgínia do Norte revelou como os data centers respondem mal às interrupções da rede. Veja como resolver o problema.

Infraestrutura· ZDNet· 25 de jul. de 2026· anteontem■

O novo Galaxy Z Fold 8 Ultra da Samsung é impressionante, mas não é o carro-chefe que me atrai

O Samsung Galaxy Z Fold 8 Ultra é um bom telefone, mas há algo muito mais atraente no Galaxy Z Fold 8.

Infraestrutura· ZDNet· 25 de jul. de 2026· anteontem■

Samsung Galaxy Z Fold 8 Ultra vs. Z Fold 7: após um ano de uso, estou pronto para atualizar

Com o mais recente telefone dobrável da Samsung, a empresa oferece mudanças de design e software que fazem com que até o Z Fold do ano passado pareça insuficiente.

Infraestrutura· MarkTechPost· 25 de jul. de 2026· anteontem▼

Datalab Marker v2 vs MinerU, Docling e Liteparse: análise de benchmark

O Datalab reescreveu o Marker como um pipeline de três modos. A versão 2 atinge 76,0 no olmOCR-bench e sustenta 2,9 páginas por segundo em um B200 – mais de 5× o backend do pipeline do MinerU, enquanto supera o Docling em precisão e velocidade. H…

Infraestrutura· MarkTechPost· 25 de jul. de 2026· anteontem■

Marcador 2 do Datalab vs MinerU, Docling e LiteParse: 76,0 no banco olmOCR com rendimento de 5× do MinerU

Infraestrutura· Hacker News· 25 de jul. de 2026· há 3 dias▲

AMD e Cerebras lançam solução de inferência de IA

URL do artigo: https://www.cerebras.ai/press-release/amd-and-cerebras-announce-industry-leading-ultra-low-latency-and-high-throughput-ai-inference URL de comentários: https://news.ycombinator.com/item?id=49041347 Pontos: 17 # C…

Infraestrutura· Ars Technica· 24 de jul. de 2026· há 3 dias■

As empresas de IA querem mais data centers; A EPA de Trump pode dar menos voz aos vizinhos

A regra permitiria que os estados decidissem quanta contribuição pública pode haver - se houver.

Infraestrutura· MarkTechPost· 24 de jul. de 2026· há 3 dias■

Como construir um pipeline de OCR ponta a ponta com o OCR ilimitado do Baidu para imagens de alta resolução e análise de PDF de várias páginas

Neste tutorial, construímos um fluxo de trabalho completo para executar o modelo Unlimited-OCR do Baidu em imagens de documentos e PDFs de várias páginas. Desde a configuração do ambiente de GPU até a comparação de inferências de Gundam em blocos de alto detalhe e rapidez…

Infraestrutura· Hacker News· 24 de jul. de 2026· há 3 dias■

Austrália para IA: Produza mais energia do que você queima, pare o 'roubo' de conteúdo

URL do artigo: https://www.theregister.com/ai-and-ml/2026/07/15/australia-demands-ai-companies-must-produce-more-energy-than-they-consume-stop-theft-of-content/5271535 URL de comentários: https://news.ycombinator.com/item?id=49…

Infraestrutura· IEEE Spectrum· 23 de jul. de 2026· há 4 dias■

NASA coloca em órbita o modelo Gemma Large Language do Google

A viabilidade dos data centers orbitais que hospedam os maiores e mais capazes modelos de linguagem de grande porte (LLMs) permanece fortemente contestada. Mas implantações enormes que exigem milhares de GPUs não são a única maneira pela qual os LLMs podem pro…

Infraestrutura· The Verge· 23 de jul. de 2026· há 4 dias▲

Os boomers de direita que protestam contra os data centers têm muito em comum com a esquerda

Uma pessoa segura cartazes durante um protesto nacional contra a expansão do data center de IA do lado de fora do Peace Hall em New Port Richey, Flórida. | AFP via Getty Images Em uma manhã cinzenta e úmida de sábado no centro da Flórida, um pouco…

Infraestrutura· NVIDIA· 23 de jul. de 2026· há 4 dias▲

Supercomputador NVIDIA AI chega on-line na Naval Postgraduate School

O fundador e CEO da NVIDIA, Jensen Huang, visitou hoje a Naval Postgraduate School em Monterey, Califórnia, para comissionar um sistema NVIDIA DGX GB300 - colocando uma das plataformas de IA mais poderosas do mundo totalmente online para…

Infraestrutura· Hacker News· 22 de jul. de 2026· há 5 dias■

A maioria dos americanos diz “não no meu quintal” para data centers de IA

URL do artigo: https://www.redfin.com/news/ai-data-centers-opposition-education-benefit/ URL de comentários: https://news.ycombinator.com/item?id=49007525 Pontos: 39 # Comentários: 53

Infraestrutura· ZDNet· 22 de jul. de 2026· há 5 dias■

Samsung Galaxy Z Fold 8 Ultra vs. Google Pixel Fold 10 Pro: você não pode perder, mas aqui está minha escolha surpresa

O Samsung Galaxy Z Fold 8 Ultra tem toda a potência bruta que você precisa, mas o preço e os acessórios do Google Pixel 10 Pro Fold podem ser uma oferta melhor.

Infraestrutura· OpenAI· 22 de jul. de 2026· há 5 dias■

Avançando na próxima era da ciência nacional

A OpenAI descreve seu compromisso com o avanço da ciência americana trabalhando com o Departamento de Energia dos EUA e laboratórios nacionais para usar IA de ponta para acelerar a descoberta.

Infraestrutura· AI News· 22 de jul. de 2026· há 5 dias▲

O projeto Galaxy da SenseTime visa a expansão doméstica de chips de IA

A SenseTime lançou o Projeto Galaxy, em parceria com quase 20 parceiros para dimensionar a infraestrutura doméstica de chips de IA na China. Em uma palestra intitulada 'Transformação Inteligente e Simbiose', Yang Fan – co-fundador da empresa…

Infraestrutura· The Verge· 22 de jul. de 2026· há 5 dias■

As empresas de serviços públicos estão prometendo nos poupar da conta de energia da IA

O compromisso foi apresentado em março e pouco fez para acalmar as preocupações até agora. | Imagem: Cath Virginia / The Verge, Getty Images Diante da reação às preocupações, o boom da IA aumentará as contas de eletricidade dos consumidores ...

Infraestrutura· TechCrunch· 22 de jul. de 2026· há 6 dias■

Espera-se que data centers usem 4x mais eletricidade até 2035

Novos data centers construídos até 2033 poderão consumir tanta eletricidade quanto a Índia consome hoje.

Infraestrutura· Hacker News· 22 de jul. de 2026· há 6 dias■

Os modelos de IA da Meta estão impulsionando a primeira onda de projetos da Missão Genesis

https://www.energy.gov/undersecretaryforscience/genesis-miss... URL de comentários: https://news.ycombinator.com/item?id=48995074 Pontos: 84 # Comentários: 56

Infraestrutura· NVIDIA· 21 de jul. de 2026· há 6 dias■

Desenvolvido para Vera Rubin, NVIDIA Spectrum-6 chega às fábricas de IA em Gigascale

A IA entrou na era da gigaescala. As fábricas de IA mais avançadas do mundo estão reunindo centenas de milhares de GPUs e CPUs para treinar modelos de ponta, potencializar a IA agente e gerar inteligência a uma velocidade sem precedentes...

Infraestrutura· WIRED· 21 de jul. de 2026· há 6 dias■

Nvidia quer possuir todos os chips dos data centers de IA

A plataforma Vera Rubin da Nvidia combina CPUs e GPUs em um único sistema, refletindo a ambição crescente da empresa de potencializar todas as camadas da infraestrutura de IA.

Infraestrutura· TechCrunch· 21 de jul. de 2026· há 7 dias■

O Google está trabalhando em um novo chip de IA projetado para tornar o Gemini mais eficiente

A Alphabet, controladora do Google, está supostamente trabalhando em um novo chip projetado para fazer com que seus modelos Gemini funcionem com muito mais eficiência.

Infraestrutura· The Decoder· 21 de jul. de 2026· há 7 dias▲

O chip “Frozen v2” do Google supostamente transforma a arquitetura do Gemini diretamente em silício para ganhos de eficiência

O Google está desenvolvendo o “Frozen v2”, um chip de servidor que incorpora a arquitetura Gemini diretamente no hardware. Segundo fontes internas, poderia ser de 6 a 10 vezes mais eficiente que as TPUs atuais. Previsto para 2028, o…

Infraestrutura· AWS ML· 21 de jul. de 2026· há 7 dias■

Como o Couchbase construiu uma arquitetura de IA multimodelo para Capella iQ com Amazon Bedrock

Esta postagem descreve como o Couchbase adotou o Amazon Bedrock para potencializar o Capella iQ com a família de modelos Claude da Anthropic, as decisões arquitetônicas por trás de sua abordagem multimodelo e os benefícios operacionais obtidos…

Infraestrutura· The Decoder· 21 de jul. de 2026· há 7 dias■

O controle da Nvidia sobre os chips de IA enfraquece à medida que a Microsoft se volta para a AMD e a Anthropic pode seguir

A Microsoft está expandindo a infraestrutura de IA do Azure com a nova plataforma Helios da AMD, que deve desafiar os sistemas GPU da Nvidia no segundo semestre de 2026. Um perfil público do GitHub sugere que a Anthropic também está testando a AMD…

Infraestrutura· NVIDIA· 20 de jul. de 2026· há 7 dias▲

Bristol Myers Squibb constrói a fábrica de IA mais avançada do setor de ciências biológicas com NVIDIA Vera Rubin

Erin Davis o chama de “SuperDuperPOD”. São duas coisas num só nome: a gigante farmacêutica Bristol Myers Squibb (BMS) já gere um dos maiores clusters de IA nas ciências da vida, com resultados sérios para mostrar.…

Infraestrutura· The Verge· 20 de jul. de 2026· há 7 dias▲

China dá um golpe duplo no domínio da IA dos EUA

As principais empresas de IA da China estão aumentando a pressão sobre o Vale do Silício, à medida que Moonshot e Alibaba revelam modelos que afirmam poder enfrentar o melhor da OpenAI e da Anthropic por uma fração do custo. O rap…

Infraestrutura· MarkTechPost· 19 de jul. de 2026· há 8 dias▲

Ajustando Qwen3 com LoRA usando NVIDIA NeMo AutoModel: um tutorial completo de fluxo de trabalho do Google Colab com GPU única

Construímos um fluxo de trabalho completo do NVIDIA NeMo AutoModel no Google Colab usando uma única GPU. Verificamos o hardware CUDA e o suporte de precisão, instalamos o NeMo AutoModel a partir da fonte e carregamos uma receita oficial Qwen3-0.6B LoRA. C…

Infraestrutura· TechCrunch· 18 de jul. de 2026· há 9 dias■

Neil Rimer acha que o dinheiro da IA está voltando

Neil Rimer, o capitalista de risco que cofundou a Index Ventures, prevê que a riqueza histórica que a IA está a gerar em Silicon Valley terá de ser redistribuída, voluntária ou involuntariamente.

Infraestrutura· The Decoder· 18 de jul. de 2026· há 10 dias■

O plano de Zuckerberg de vender o excesso de computação de IA pode encontrar seu primeiro grande cliente na Anthropic

A Meta está supostamente em negociações com a Anthropic para alugar capacidade computacional de seus data centers. O artigo O plano de Zuckerberg para vender o excesso de computação de IA pode encontrar seu primeiro grande cliente na Anthropic apareceu pela primeira vez em Th…

Infraestrutura· The Decoder· 18 de jul. de 2026· há 10 dias▲

Assim como Deepseek, o Kimi K3 da China está forçando os laboratórios ocidentais de IA a questionar sua vantagem computacional

A Moonshot AI lançou o Kimi K3, um modelo que pelas primeiras avaliações corresponde ao Opus 4.8 da Anthropic, construído por uma equipe de apenas 300 pessoas. Até o estrategista da OpenAI, Dean W. Ball, chama isso de "muito bom", mas, é claro, avisa que…

Infraestrutura· ZDNet· 18 de jul. de 2026· há 10 dias▲

Este Levoit é o melhor purificador de ar inteligente que testei (e está à venda)

O Levoit Vital 200S-P é o purificador de ar inteligente a ser batido, com pré-filtro lavável e capacidade de limpar até 1.800 pés quadrados em uma hora.

Infraestrutura· ZDNet· 17 de jul. de 2026· há 10 dias▲

Testei esta central elétrica reserva durante um apagão real - não cometa meus erros

Um verdadeiro apagão de três dias revelou problemas que eu nunca teria encontrado na folha de especificações de uma usina de energia.

Infraestrutura· OpenAI· 17 de jul. de 2026· há 10 dias■

Um scorecard para a era da IA

Sarah Friar, CFO da OpenaAI, apresenta um scorecard prático de IA para medir o ROI por meio de trabalho útil, custo por tarefa bem-sucedida, confiabilidade e retorno da computação.

Infraestrutura· Simon Willison· 17 de jul. de 2026· há 10 dias▲

Observe pássaros, não jogue golfe

<p>Sugestão para hiperscaladores que sentem pressão sobre o uso da água no data center:</p> <p>Compre alguns clubes de campo exclusivos, converta os campos de golfe em parques públicos, pague por guias e binóculos para obter o membro anterior…

Infraestrutura· WIRED· 17 de jul. de 2026· há 11 dias▲

Por que a Apple processou a OpenAI, Nova York assume data centers e o que saber sobre a ciclosporíase

No Uncanny Valley de hoje, desvendamos o drama contínuo da OpenAI, tanto jurídico quanto de reputação, e se esses desenvolvimentos poderiam prejudicar ainda mais a empresa – especialmente em sua luta contra a Antrópica.

Infraestrutura· VentureBeat· 17 de jul. de 2026· há 11 dias■

A lacuna computacional da IA: as empresas estão comprando infraestrutura mais rápido do que conseguem medir quanto custa

Em 107 empresas, os gastos com infraestruturas de IA estão a acelerar muito antes da capacidade de ver ou orientar a sua economia. A maioria das organizações executa sua IA em uma base familiar de hiperescaladores e APIs de provedores de modelos, ainda…

Infraestrutura· MarkTechPost· 16 de jul. de 2026· há 11 dias■

Guia Patter SDK para construir um agente telefônico para reservas de restaurantes com variáveis dinâmicas, proteções, painéis de latência e verificações de avaliação

Exploramos o Patter SDK criando um fluxo de trabalho de agente de voz para um caso de uso de reserva de restaurante. Definimos variáveis dinâmicas de chamador, registramos ferramentas solicitáveis para disponibilidade, reservas, horas e transferência humana, e…

Infraestrutura· NVIDIA· 16 de jul. de 2026· há 11 dias▲

NVIDIA apresenta novos computadores Jetson Thor para aprimorar a robótica convencional e a IA de ponta

Robôs de uso geral e máquinas autônomas estão migrando de laboratórios de pesquisa para implantação no mercado de massa no mundo real, criando demanda por supercomputadores de IA compactos e com baixo consumo de energia, capazes de executar modelos básicos em t…

Infraestrutura· AWS ML· 16 de jul. de 2026· há 12 dias■

Built Technologies cria uma solução de inteligência de documentos baseada em IA na AWS para capacitar agentes em finanças imobiliárias

Criado em parceria com o AWS Generative AI Innovation Center (GenAIIC), AWS Partner AND Digital e equipes de contas da AWS para criar um mecanismo de processamento de documentos escalonável e alimentado por IA que pode classificar, dividir, extrair, avaliar…

Infraestrutura· ZDNet· 15 de jul. de 2026· há 12 dias▲

Quatro meses com minha primeira bateria doméstica me ensinaram o que realmente significa backup para toda a casa

O Solix E10 da Anker tornou a energia de reserva compreensível para este novato, e mal posso esperar para expandir o sistema.

Infraestrutura· TechCrunch· 14 de jul. de 2026· há 13 dias▲

Estado de Nova York interrompe construção de todos os novos data centers

Nova York se tornou o primeiro estado a suspender temporariamente a aprovação de grandes data centers, já que a governadora Kathy Hochul argumenta que o boom da construção impulsionado pela IA não deveria ocorrer às custas de custos mais elevados de eletricidade, abastecimento de água,…

Infraestrutura· Ars Technica· 14 de jul. de 2026· há 13 dias■

Nova York proíbe a construção de data centers por um ano, abalando a indústria de IA

A moratória dos centros de dados de Nova Iorque pode tornar-se o modelo para o movimento anti-IA.

Infraestrutura· NVIDIA· 14 de jul. de 2026· há 13 dias■

Por que o desempenho por Watt é a métrica definitiva para a eficiência da infraestrutura de IA

A energia é a restrição inevitável da infraestrutura de IA. Quantos tokens uma fábrica de IA pode gerar dentro de um orçamento fixo de energia determina sua receita e lucratividade. Por causa disso, desempenho por watt — uma métrica que…

Infraestrutura· The Verge· 14 de jul. de 2026· há 13 dias■

Demis Hassabis, do Google, diz que é hora de um vigilante global da IA – liderado pelos EUA

Demis Hassabis, durante sessão de painel no Fórum Econômico Mundial em Davos, Suíça. | Imagem: Bloomberg via Getty Images Demis Hassabis acha que o mundo precisa de um cão de guarda de IA com o poder de pisar no freio se estiver à frente…

Infraestrutura· Hacker News· 14 de jul. de 2026· há 13 dias■

Família da Geórgia diz que é forçada a vender casa para alimentar data centers de IA

URL do artigo: https://www.cbsnews.com/news/georgia-power-ai-data-centers-eminent-domain/ URL de comentários: https://news.ycombinator.com/item?id=48901420 Pontos: 19 # Comentários: 4

Infraestrutura· TechCrunch· 14 de jul. de 2026· há 14 dias▼

Satya Nadella emitiu um aviso chocante para empresas que usam IA

De todos os debates sobre as possíveis desvantagens da IA, há uma preocupação que causa a maior preocupação entre os entusiastas da IA no Vale do Silício - que os gigantescos laboratórios de IA que vendem modelos proprietários sejam de alguma forma um…

Infraestrutura· ZDNet· 13 de jul. de 2026· há 14 dias■

Os melhores computadores multifuncionais de 2026: testados e revisados por especialistas

Testamos os melhores computadores multifuncionais que combinam a potência de um PC desktop com um design fino e leve.

Infraestrutura· The Verge· 12 de jul. de 2026· há 15 dias▼

A luta contra os data centers de IA está apenas começando

Uma placa de pátio oposta a um data center planejado é exibida ao longo da Rota 54 em Mount Carmel Township Northumberland County. | Imagem: Getty Images This is The Stepback, um boletim informativo semanal que detalha uma história essencial de…

Infraestrutura· MarkTechPost· 12 de jul. de 2026· há 15 dias▼

Um guia de codificação para programação de GPU baseada em blocos da NVIDIA: dos kernels cuTile e Triton à atenção do Flash

Neste tutorial, exploramos a programação de GPU baseada em blocos NVIDIA com TileGym, construindo um fluxo de trabalho Colab que é executado em diferentes hardwares. Testamos o ambiente CUDA, testamos o backend cuTile real e voltamos para Tr…

Infraestrutura· The Decoder· 11 de jul. de 2026· há 16 dias▲

OpenAI admite que “não acertou tudo” com o lançamento do ChatGPT Work e se esforça para consertar UX e custos

Após o lançamento do ChatGPT Work e do GPT-5.6 Sol, a OpenAI reconheceu problemas significativos: uso excessivo de computação, uma transição confusa para a interface de desktop para bate-papos e projetos, uma distinção pouco clara entre…

Infraestrutura· Hacker News· 11 de jul. de 2026· há 17 dias■

Os modelos abertos de IA da China estão avançando em seu soft power global

URL do artigo: https://www.noemamag.com/chinas-open-ai-models-are-advancing-its-global-soft-power/ URL de comentários: https://news.ycombinator.com/item?id=48865717 Pontos: 17 # Comentários: 0

Infraestrutura· AWS ML· 10 de jul. de 2026· há 17 dias■

Implantar modelos quantizados no Amazon SageMaker AI com Unsloth

Nesta postagem, você aprenderá quatro padrões de implantação para pegar modelos que já foram quantizados com Unsloth e implantá-los na infraestrutura AWS. Os padrões usam Amazon Elastic Compute Cloud (Amazon EC2)…

Infraestrutura· The Verge· 10 de jul. de 2026· há 17 dias▲

Você hospedaria parte de um data center de IA em sua casa?

Uma empresa de armazenamento de energia solar e doméstica está a expandir-se para centros de dados de IA, mas não através da construção de um - em vez disso, está a oferecer-se para pagar aos seus clientes para colocarem as suas unidades de computação nas suas casas. Sunrun está lançando um programa piloto…

Infraestrutura· ZDNet· 10 de jul. de 2026· há 17 dias■

Os melhores serviços de hospedagem VPS para 2026: testados e revisados por especialistas

Se você precisar de mais potência do que os serviços de hospedagem compartilhada podem fornecer, os principais provedores de hospedagem VPS podem fornecer os recursos dedicados e a escalabilidade necessários para levar seu projeto ao próximo nível.

Infraestrutura· TechCrunch· 10 de jul. de 2026· há 17 dias▲

OpenAI diz que GPT 5.6 é o ‘modelo preferido’ para Microsoft Copilot 365 em meio a conversas sobre rompimento

A nova família de modelos da OpenAI continuará a impulsionar o conjunto de aplicativos de trabalho e produtividade da Microsoft.

Infraestrutura· MarkTechPost· 10 de jul. de 2026· há 18 dias▲

Conheça Nemotron Labs 3 Puzzle 75B A9B: um MoE LLM híbrido compactado que oferece taxa de transferência de servidor 2,03x

A NVIDIA lançou o Nemotron-Labs-3-Puzzle-75B-A9B, uma variante compactada do Nemotron-3-Super. O Iterative Puzzle alterna compressão estrutural com reconhecimento de hardware com fases curtas de recuperação de destilação de conhecimento. O modo…

Infraestrutura· TechCrunch· 10 de jul. de 2026· há 18 dias■

A Nvidia é vítima do mercado de computação que criou

Tendo provado o quão valiosa a computação pode ser, a empresa encontra-se no centro de um mercado em que todos desejam estar – enquanto tecnologias mais simples e empresas menos interessantes enriquecem à margem.

Infraestrutura· Hacker News· 9 de jul. de 2026· há 18 dias■

DeepSeek pretende fazer seu próprio chip de IA

URL do artigo: https://www.proactiveinvestors.com/companies/news/1095178/deepseek-makes-pivot-that-should-put-silicon-valley-on-high-alert-1095178.html URL de comentários: https://news.ycombinator.com/item?id=48846708 Pontos: 4…

Infraestrutura· NVIDIA· 9 de jul. de 2026· há 18 dias▲

GeForce NOW aumenta a temperatura com o novo servidor Toronto com tecnologia GeForce RTX 5080

Esta quinta-feira GFN traz mais jogos, mais potência e mais maneiras de jogar no GeForce NOW. O serviço de jogos em nuvem está se expandindo com um novo servidor com GeForce RTX 5080 em Toronto, trazendo alto desempenho dedicado em t…

Infraestrutura· MarkTechPost· 9 de jul. de 2026· há 18 dias▲

NVIDIA lança Nemotron-Labs-3-Puzzle-75B-A9B: um LLM MoE híbrido compactado que oferece taxa de transferência de servidor 2,03x com taxa de transferência de usuário correspondente

Infraestrutura· TechCrunch· 8 de jul. de 2026· há 19 dias■

O ex-executivo da OpenAI Kevin Weil agora faz parte do conselho da Stoke Space

A nova função de Kevin Weil na Stoke Space sugere que foguetes reutilizáveis são a próxima novidade no Vale do Silício.

Infraestrutura· ZDNet· 8 de jul. de 2026· há 19 dias■

Por que deixar cabos de extensão conectados permanentemente é mais arriscado do que você imagina

Claro, cabos de extensão residenciais e filtros de linha são úteis, mas também resultam em milhares de incêndios evitáveis a cada ano. Veja como usá-los com mais segurança.

Infraestrutura· Ars Technica· 8 de jul. de 2026· há 20 dias■

A demanda de energia dos data centers ameaça o plano “Made in America” de Trump

Apertar as contas de eletricidade do Rust Belt ameaça o plano de produção de Trump.

Infraestrutura· TechCrunch· 8 de jul. de 2026· há 20 dias▼

A Microsoft adere à tendência de corte de custos de IA confiando mais em seus próprios modelos

A Microsoft é a mais recente gigante do Vale do Silício a reduzir seus gastos com IA.

Infraestrutura· The Decoder· 7 de jul. de 2026· há 20 dias▲

Deepseek está projetando seu próprio chip de IA

A startup chinesa Deepseek está construindo seu próprio chip de IA, relata a Reuters. O artigo Deepseek está projetando seu próprio chip de IA apareceu pela primeira vez no The Decoder.

Infraestrutura· MarkTechPost· 7 de jul. de 2026· há 20 dias▼

OpenAI lança GPT-Realtime-2.1 e GPT-Realtime-2.1-mini para agentes de voz de baixa latência na API

OpenAI adicionou dois modelos Realtime à sua API. GPT-Realtime-2.1-mini é um mini modelo de raciocínio para voz, com preço semelhante ao gpt-realtime-mini anterior. A OpenAI também reduziu a latência do p95 em pelo menos 25% por meio de cache aprimorado. Ele…

Infraestrutura· ZDNet· 6 de jul. de 2026· há 21 dias■

Claude Fable 5 está de volta, mas continuo com o Opus 4.8 para o trabalho diário: 5 motivos

O Fable 5 da Anthropic promete um poder mítico de IA, mas restrições surpreendentes me fazem pensar se é mais problemático do que vale para o uso diário.

Infraestrutura· Hacker News· 5 de jul. de 2026· há 22 dias■

A concentração de poder na IA é um risco, por Andy Konwinski

URL do artigo: https://xcancel.com/i/article/2072830533739192560 URL de comentários: https://news.ycombinator.com/item?id=48792463 Pontos: 17 # Comentários: 1

Infraestrutura· Hacker News· 5 de jul. de 2026· há 23 dias■

O clustering de token de raciocínio Codex GPT-5.5 pode estar levando à degradação do desempenho

URL do artigo: https://github.com/openai/codex/issues/30364 URL de comentários: https://news.ycombinator.com/item?id=48789428 Pontos: 131 # Comentários: 41

Infraestrutura· Hacker News· 3 de jul. de 2026· há 24 dias■

Relatório de data centers de IA usam mais água do que a maioria dos gigantes da tecnologia

URL do artigo: https://www.wsj.com/tech/ai/ai-data-centers-water-use-901e2902 URL de comentários: https://news.ycombinator.com/item?id=48774246 Pontos: 18 # Comentários: 6

Infraestrutura· IEEE Spectrum· 3 de jul. de 2026· há 24 dias■

O uso de energia volátil da IA testa silenciosamente os limites da rede

A rápida expansão da infraestrutura de inteligência artificial é normalmente enquadrada como um problema energético. Prevê-se que os data centers consumam uma parcela crescente da demanda global de eletricidade: A Agência Internacional de Energia…

Infraestrutura· TechCrunch· 3 de jul. de 2026· há 25 dias■

Anthropic está discutindo um novo chip personalizado com a Samsung

A notícia chega cerca de uma semana depois que a OpenAI anunciou seu próprio chip de IA personalizado em parceria com a Broadcom.

Infraestrutura· The Decoder· 3 de jul. de 2026· há 25 dias■

A Anthropic supostamente explora a fabricação de chips personalizados com a Samsung, enquanto insiste que a Nvidia ainda é importante

A Anthropic está supostamente em negociações com a Samsung Electronics sobre a fabricação de um chip de IA personalizado. O projeto ainda é inicial, mas a Anthropic já contratou engenheiros de chips. Depois do "Jalapeño" da OpenAI, mais uma grande IA…

Infraestrutura· ZDNet· 2 de jul. de 2026· há 25 dias■

Finalmente, um robô aspirador e esfregão sem odores que não tem problemas em manusear o cabelo do meu animal de estimação

O Eufy Omni S2 é uma melhoria em relação ao seu antecessor com quatro vezes mais poder de sucção e um rolo de esfregão sem odores.

Infraestrutura· The Decoder· 2 de jul. de 2026· há 25 dias▲

Nvidia está financiando startups de IA para afrouxar o controle da Big Tech em seu negócio de chips

A Nvidia está agindo cada vez mais como um banco central para startups de IA, moldando ativamente o mercado de computação. O artigo A Nvidia está financiando startups de IA para afrouxar o controle da Big Tech sobre seu negócio de chips apareceu pela primeira vez no…

Infraestrutura· Ars Technica· 2 de jul. de 2026· há 25 dias■

A construção de IA do Google impulsionou um aumento de 37% no uso de eletricidade em 2025

O Google tenta equilibrar as emissões de data centers de IA com esforços de energia limpa.

Infraestrutura· Hacker News· 2 de jul. de 2026· há 25 dias■

Meta construindo negócios em nuvem para vender capacidade excedente de IA

URL do artigo: https://www.reuters.com/business/meta-sell-excess-ai-computing-capacity-via-cloud-business-bloomberg-news-reports-2026-07-01/ URL de comentários: https://news.ycombinator.com/item?id=48759329 Pontos: 26 # Comentário…

Infraestrutura· NVIDIA· 2 de jul. de 2026· há 25 dias■

NVIDIA lança computação de IA em escala, convidando parceiros de capital para impulsionar a construção da infraestrutura de IA

À medida que a IA passa do desenvolvimento de modelos para a inferência de produção, a demanda computacional está acelerando e mudando para fábricas de IA em operação contínua que geram tokens em escala. Esta mudança requer acesso a larga escala…

Infraestrutura· TechCrunch· 2 de jul. de 2026· há 26 dias▲

Ashton Kutcher deixando a Sound Ventures para lançar uma nova empresa de capital de risco com Morgan Beller

A Sound construiu sua reputação com base em apostas concentradas e de alta convicção em laboratórios de IA líderes da categoria, enquanto o novo fundo de Kutcher parece estar perseguindo a camada abaixo dessas empresas – a infraestrutura e a energia que alimentam…

Infraestrutura· IEEE Spectrum· 2 de jul. de 2026· há 26 dias▲

À medida que a IA remodela os sistemas energéticos globais, Melbourne lidera através da colaboração em engenharia

Este artigo foi apresentado a você pelo Melbourne Convention Bureau (MCB), apoiado pela Business Events Australia. À medida que a inteligência artificial acelera a procura global por computação, surge uma restrição paralela com igual…

Infraestrutura· TechCrunch· 1 de jul. de 2026· há 26 dias▲

Meta, como a SpaceX, busca transformar o excesso de computação de IA em dinheiro

A Meta está desenvolvendo planos para um negócio de infraestrutura em nuvem, vendendo acesso a modelos e poder de computação de IA. A mudança o colocaria contra grandes provedores de nuvem como Amazon Web Services, Google Cloud e Microsoft Az…

Infraestrutura· Hacker News· 1 de jul. de 2026· há 26 dias■

Meta está construindo um negócio em nuvem para vender o excesso de computação de IA

URL do artigo: https://www.bloomberg.com/news/articles/2026-07-01/meta-is-building-a-cloud-business-to-sell-excess-ai-compute URL de comentários: https://news.ycombinator.com/item?id=48745966 Pontos: 15 # Comentários: 11

Infraestrutura· IEEE Spectrum· 1 de jul. de 2026· há 26 dias■

A máquina Hype do data center orbital já está em órbita

“O lugar de menor custo para colocar IA será no espaço, e isso será verdade dentro de dois anos, talvez três no máximo”, disse o fundador da SpaceX, Elon Musk, no Fórum Econômico Mundial em Davos em janeiro passado, enquanto sua empresa estava…

Infraestrutura· The Decoder· 1 de jul. de 2026· há 27 dias▼

A OpenAI supostamente reduziu os custos de resposta para usuários convidados do ChatGPT em mais da metade

De acordo com um relatório da The Information, a OpenAI reduziu os custos de inferência para seus modelos de IA em mais da metade. A empresa aplicou as otimizações ao ChatGPT, onde o número de GPUs Nvidia necessárias caiu para apenas alguns…

Infraestrutura· NVIDIA· 1 de jul. de 2026· há 27 dias■

NVIDIA BioNeMo Agent Toolkit traz IA acelerada para pesquisadores de ciências biológicas na Claude Science

As ciências biológicas entraram em uma era de escala computacional e, por mais de uma década, a NVIDIA construiu a pilha completa de computação acelerada por GPU – abrangendo hardware, estruturas, bibliotecas, modelos, microsserviços e domínio…

Infraestrutura· AWS ML· 1 de jul. de 2026· há 27 dias■

Como o Outpost VFX usa AWS para acelerar o treinamento de modelos de IA para efeitos visuais

Nesta postagem, exploramos como o Outpost VFX alcançou velocidades de treinamento 8x mais rápidas usando a infraestrutura AWS para transformar seu fluxo de trabalho de substituição facial, a arquitetura técnica que eles implementaram para superar o limite de GPU único…

Infraestrutura· The Decoder· 30 de jun. de 2026· há 27 dias▲

Taiwan invade escritórios da Super Micro em investigação sobre contrabando de chips Nvidia para a China

As autoridades de Taiwan invadiram os escritórios da Super Micro Computer e de várias empresas parceiras locais. O artigo Taiwan invade escritórios da Super Micro em investigação sobre contrabando de chips Nvidia para a China apareceu pela primeira vez no…

Infraestrutura· Hacker News· 30 de jun. de 2026· há 27 dias■

Por que a Europa não constrói data centers de IA na Islândia?

URL do artigo: https://mrkt30.com/why-wont-europe-build-ai-data-centers-in-iceland/ URL de comentários: https://news.ycombinator.com/item?id=48727538 Pontos: 27 # Comentários: 22

Infraestrutura· ZDNet· 30 de jun. de 2026· há 28 dias■

Eu sempre mantenho esses 3 dispositivos conectados à minha estação de energia - aqui está o porquê

Veja como aproveitar os recursos da sua estação de energia quando não for durante uma emergência.

Infraestrutura· AI News· 29 de jun. de 2026· há 28 dias■

O xFusion dimensiona a IA empresarial de estações de trabalho de borda para data centers refrigerados a líquido

A xFusion apresentou modelos escaláveis de computação de IA empresarial no ISC 2026, fazendo a transição de hardware de dispositivos de ponta para data centers. Os compradores de tecnologia empresarial presentes na exposição de Hamburgo buscaram produção prática…

Infraestrutura· Hacker News· 29 de jun. de 2026· há 28 dias■

Agente de IA desencadeia ataque nuclear após ser derrotado em Civilization VI

URL do artigo: https://decrypt.co/371877/ai-agent-nuclear-strike-civilization-vi-benchmark URL de comentários: https://news.ycombinator.com/item?id=48712791 Pontos: 15 # Comentários: 2

Infraestrutura· ZDNet· 28 de jun. de 2026· há 29 dias■

Já vivi com energia solar em casa há anos - 12 mitos que você pode ignorar com segurança em 2026

Conhecer os fatos sobre energia solar residencial pode ajudar você a fazer escolhas melhores e informadas, economizar dinheiro e se manter seguro.

Infraestrutura· The Decoder· 28 de jun. de 2026· há 29 dias■

Empresa chinesa de segurança cibernética constrói ferramentas de IA para rivalizar com a Mythos e enquadra a corrida como uma dissuasão cibernética nuclear

O fundador da 360, Zhou Hongyi, apresenta duas ferramentas de segurança de IA projetadas para competir com o Mythos da Anthropic. Um deles já sinalizou 3.432 vulnerabilidades. Zhou admite que os modelos chineses estão atrás dos ocidentais em 20 a 30 por cento, mas c…

Infraestrutura· TechCrunch· 28 de jun. de 2026· mês passado■

O CEO do SoftBank não é o único com dúvidas sobre o hype do data center orbital de Elon Musk

Nem todo mundo está acreditando na visão de Elon Musk para data centers orbitais.

Infraestrutura· Hacker News· 27 de jun. de 2026· mês passado■

Pergunte a HN: MacBook vs. GPU dedicada para LLM

Para quem usa llms no macbook, quer entender como o macbook é diferente da GPU dedicada na execução desses modelos? e como saber o quanto um macbook é capaz de rodar um modelo? URL dos comentários: https://ne…

Infraestrutura· TechCrunch· 27 de jun. de 2026· mês passado▲

Por que todos, da OpenAI à SpaceX, estão construindo seus próprios chips (e aumentando a pressão sobre a Nvidia)

A Nvidia domina o mercado de chips de IA há anos, mas a era de dependência total pode estar terminando. A OpenAI acaba de compartilhar seus planos para apimentar as coisas com o Jalapeño, seu chip de inferência personalizado desenvolvido com a Broadcom, juntando-se ao G…

Infraestrutura· TechCrunch· 26 de jun. de 2026· mês passado▲

O chip Jalapeño da OpenAI é a mudança mais picante da Big Tech em relação à Nvidia

Infraestrutura· WIRED· 26 de jun. de 2026· mês passado■

Anthropic pensa que seu próprio sucesso é essencial para tornar a IA segura

Os críticos da Anthropic argumentam que a empresa está rapidamente acumulando poder. A empresa diz que isso é o que parece no desenvolvimento responsável da IA.

Infraestrutura· WIRED· 26 de jun. de 2026· mês passado▼

Por que a Amazon Abandonou Seu Filme da OpenAI, os Trabalhadores dos Centros de Dados Lutam de Volta e a Meta Vaza Dados de Funcionários

A decisão da MGM Studios, controlada pela Amazon, de abandonar o filme da OpenAI é apenas parte do entrelaçamento cada vez maior entre a indústria de IA e a indústria cinematográfica. No Val do Uncanny, analisamos para onde tudo isso vai.

Infraestrutura· ZDNet· 26 de jun. de 2026· mês passado▲

Todos os MacBooks e iPads são surpreendidos com aumentos de preço - até o Neo não ficou seguro

Os aumentos de preço resultam do aumento dos custos dos chips de memória e da falta de fornecimento, mas ainda há ofertas disponíveis se você souber onde procurar.

Infraestrutura· TechCrunch· 26 de jun. de 2026· mês passado▼

Ex-chefe de IA da Databricks acredita que pode reduzir a conta de energia da IA em 1.000x

Un-0 é uma ferramenta de sistema de geração de imagens que mostra pela primeira vez como a tecnologia da empresa pode replicar sistemas de IA convencionais.

Infraestrutura· ZDNet· 25 de jun. de 2026· mês passado■

Encontrei 5 ofertas de GPU do Dia Primeiro para aproveitar agora - antes de pagar o preço integral

É um mercado difícil para GPUs, mas ainda há algumas boas ofertas durante o Dia Primeiro da Amazon. Aqui estão as cinco que vale a pena conferir.

Infraestrutura· The Verge· 25 de jun. de 2026· mês passado▲

Ford teve que contratar novamente engenheiros antigos para corrigir erros cometidos por seus sistemas automatizados

Para celebrar seu novo status como número 1 no ranking inicial de qualidade da JD Power entre os fabricantes de automóveis tradicionais, a Ford está abrindo sobre os desafios que enfrentou nos últimos anos, especialmente em torno de sua dependência em sistemas automatizados...

Infraestrutura· OpenAI· 25 de jun. de 2026· mês passado▲

Projetando organizações que possam acompanhar a IA

Por que a latência organizacional está se tornando a maior barreira para a plena realização dos benefícios da IA

Infraestrutura· The Decoder· 25 de jun. de 2026· mês passado■

Qualcomm entra no mercado de data centers com seu próprio processador

A Qualcomm está avançando ainda mais no mercado de data centers com um novo processador chamado Dragonfly C1000. O artigo Qualcomm entra no mercado de data centers com seu próprio processador apareceu primeiro no The Decoder.

Infraestrutura· Ars Technica· 25 de jun. de 2026· mês passado■

IBM afirma ter a primeira tecnologia de chip sub-1 nanômetro do mundo

Os transistores nanostack da IBM poderiam melhorar o desempenho ou a eficiência energética dos chips.

Infraestrutura· AI News· 25 de jun. de 2026· mês passado■

A matemática por trás do chip Jalapeño da OpenAI

A trajetória financeira da OpenAI depende fortemente dos custos de infraestrutura, uma realidade que impulsionou o desenvolvimento do novo chip customizado OpenAI Jalapeño. Desenvolvido em colaboração com a Broadcom, o chip específico de aplicação integ…

Infraestrutura· Ars Technica· 25 de jun. de 2026· mês passado▲

OpenAI e Broadcom anunciam chip projetado para inferência em larga escala de LLM

A corrida pelo silício está ficando cada vez mais quente no meio da luta para acompanhar a demanda.

Infraestrutura· MarkTechPost· 25 de jun. de 2026· mês passado▲

Gradium Lança stt-translate e s2s-translate, Modelos de Tradução de Voz em Tempo Real Superando gpt-realtime-translate em Precisão e Latência

Gradium lançou dois modelos de tradução de voz em tempo real, stt-translate e s2s-translate, cobrindo inglês, francês, alemão, espanhol e português em 20 pares de idiomas. Os modelos reduzem o padrão de três modelos...

Infraestrutura· TechCrunch· 25 de jun. de 2026· mês passado■

OpenAI apresenta seu primeiro chip personalizado, construído pela Broadcom

Anúncio: https://openai.com/index/openai-broadcom-jalapeno-inference-... https://decrypt.co/371971/openai-broadcom-jalapeno-first-cus... https://www.cnn.com/2026/06/24/tech/openai-broadcom-jalapeno... Comentários:…

Infraestrutura· AWS ML· 25 de jun. de 2026· mês passado▲

Como a Loka Construiu um Agente de Voz Natural e de Baixa Latência com o Amazon Nova 2 Sonic

Neste post, demonstramos a arquitetura e abordagem que a Loka usou para resolver uma frustração comum: assistentes de voz robóticos e lentos que fazem os clientes desligarem, danificando a reputação da marca e aumentando os custos de suporte.

Infraestrutura· The Verge· 24 de jun. de 2026· mês passado■

OpenAI revela seu primeiro processador de IA: Jalapeño

OpenAI acabou de revelar um novo "processador de inteligência" em chip para servidores de IA, feito em parceria com a Broadcom. O chip, chamado Jalapeño, é projetado para alimentar modelos de linguagem grandes atuais e futuros, de acordo com uma an…

Infraestrutura· The Decoder· 24 de jun. de 2026· mês passado■

OpenAI e Broadcom apresentam "Jalapeño", um chip personalizado desenvolvido para inferência de modelos de linguagem grandes

A OpenAI está adicionando hardware personalizado à sua pilha tecnológica. O chip "Jalapeño", desenvolvido com a Broadcom, é projetado para inferência de modelos de linguagem grandes e está programado para operar em larga escala até o final de 2026. O artigo OpenAI e Broadcom u…

Infraestrutura· Hacker News· 24 de jun. de 2026· mês passado■

OpenAI e Broadcom apresentam chip de inferência otimizado para LLM

URL do artigo: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ URL dos comentários: https://news.ycombinator.com/item?id=48659257 Pontos: 141 # Comentários: 1

Infraestrutura· The Decoder· 24 de jun. de 2026· mês passado■

CEO do Pangram diz que modelos de linguagem revelam a si mesmos ao fazerem os mesmos argumentos

Modelos de linguagem podem escrever prosa mais limpa do que a maioria dos humanos, mas peça a um 100 argumentos sobre um tema e todos se agruparão juntos. O raciocínio humano é muito mais diversificado, diz o CEO do Pangram, Max Spero, e isso é o que pode...

Infraestrutura· MarkTechPost· 24 de jun. de 2026· mês passado▲

DFlash Decodificação Speculativa Drafta Blocos de Tokens Inteiros em Paralelo para Até 15x Mais Throughput no NVIDIA Blackwell

O DFlash da UC San Diego substitui a redação autoregressiva por um modelo leve de difusão de bloco para decodificação especulativa. Ele redige blocos de tokens inteiros em uma única passada para frente e condição sobre características ocultas alvo…

Infraestrutura· OpenAI· 24 de jun. de 2026· mês passado■

OpenAI e Broadcom apresentam chip de inferência otimizado para LLM

OpenAI e Broadcom introduzem Jalapeño, um chip AI personalizado construído para inferência de LLM para melhorar o desempenho, eficiência e escala em sistemas de IA.

Infraestrutura· NVIDIA· 24 de jun. de 2026· mês passado■

NVIDIA e AWS Colaboram para Trazer IA para Produção em Escala

Construir sistemas de IA em escala é desafiador, exigindo inferência de baixa latência, busca vetorial rápida, forte relação custo-desempenho de GPUs e infraestrutura que pode crescer sem multiplicar a complexidade operacional. A NVIDIA lançou a mais recente...

Infraestrutura· MarkTechPost· 24 de jun. de 2026· mês passado■

Como usar o NVIDIA Canary-1B-v2 para ASR, Tradução e Exportação Automática de Legendas em Python

Neste tutorial, construímos um pipeline de ASR e tradução multilíngue com o NVIDIA Canary-1B-v2. Carregamos o modelo em um runtime habilitado para GPU, preparamos áudio em 16 kHz mono e executamos ASR em inglês. Em seguida, traduzimos...

Infraestrutura· Hacker News· 23 de jun. de 2026· mês passado▲

Show HN: O Gráfico Cascade – Um mapa interativo de restrições de IA e energia

Olá, eu queria compartilhar com todos vocês um mapa interativo das restrições econômicas e físicas da implementação da IA. Ele tem drivers macroeconômicos, gargalos industriais e onde isso se manifesta nos mercados. Adicionei 393 nós...

Infraestrutura· NVIDIA· 23 de jun. de 2026· mês passado▲

A NVIDIA move mais de 400 dos 500 supercomputadores mais rápidos do mundo

Destaque das Notícias: A tecnologia da NVIDIA opera em 81% do TOP500 e em 90% dos sistemas novos na lista. 26 sistemas do TOP500 adotaram o CPU NVIDIA Grace, oito a mais do que na lista anterior. Os oito sistemas mais rápidos no Gree…

Infraestrutura· AI News· 23 de jun. de 2026· mês passado▲

Principais agências de espionagem afirmam que ameaças cibernéticas de IA afetarão você em poucos meses. Aqui está o porquê

O aumento global nas ameaças cibernéticas de IA já não é um problema distante para os centros de dados corporativos, de acordo com um aviso público urgente da aliança de inteligência mais poderosa do mundo. Em 22 de junho de 2026, a ciberseg…

Infraestrutura· OpenAI· 23 de jun. de 2026· mês passado■

Como a Omio está construindo o futuro do viagem conversacional

Descubra como a Omio usa a OpenAI para impulsionar experiências de viagem conversacional, acelerar o desenvolvimento de produtos e transformar-se em uma empresa nativa de IA.

Infraestrutura· The Verge· 23 de jun. de 2026· mês passado▲

Nvidia diz que seu design de centro de dados de IA opera mais quente para usar muito menos água

A reação pública contra os centros de dados tem enfatizado seu consumo de água e energia, e agora a Nvidia destaca sua alegação de que o design de referência da geração Rubin para um centro de dados completamente refrigerado a líquido tem "elim…

Infraestrutura· TechCrunch· 23 de jun. de 2026· mês passado▼

A Nvidia quer reduzir o uso de água nos centros de dados, mas isso não é o mesmo que resolver o problema de água da IA

A Nvidia anunciou um novo sistema de resfriamento que reduz o uso de água dentro dos centros de dados. Mas isso não faz nada para abordar o maior uso de água da IA — as usinas de combustível fóssil.

Infraestrutura· The Decoder· 23 de jun. de 2026· mês passado■

A Microsoft está construindo um centro de dados de 2 gigawatts no Texas com sua própria usina de gás para evitar a rede

A Microsoft está construindo um campus de centro de dados de cerca de 2 gigawatts em Pecos, Texas, um dos maiores aumentos de capacidade única da história da empresa. Em uma carta aberta, a empresa promete preços estáveis de energia e uso mínimo de água...

Infraestrutura· NVIDIA· 22 de jun. de 2026· mês passado▲

No ISC, o JUPITER mostra como a ciência exascale se parece

JUPITER, o primeiro supercomputador exascale da Europa, localizado no Forschungszentrum Jülich na Alemanha, opera com os Superchips NVIDIA Grace Hopper e a rede de comunicação NVIDIA Quantum-X800 InfiniBand — e teve um ano ativo. Como o…

Infraestrutura· NVIDIA· 22 de jun. de 2026· mês passado▲

NVIDIA Vera CPU abre caminho para AI Científica Agente no Laboratório Nacional de Los Alamos

Missão, Visão e Veracidade — novos supercomputadores do Laboratório Nacional de Los Alamos (LANL) a serem construídos com HPE e NVIDIA — estão utilizando CPUs NVIDIA Vera para acelerar a descoberta científica, liberando AI agente para a ciência.…

Infraestrutura· NVIDIA· 22 de jun. de 2026· mês passado■

Eco Wave Power Transforma Ondas em Wats com Infraestrutura de IA da NVIDIA e Duplas Digitais

A próxima era da IA não será definida apenas pelo processamento. Seu crescimento será determinado pela energia. À medida que a computação acelerada se expande por fábricas de IA, IA agente, IA industrial, computação de borda e IA física, incluindo...

Infraestrutura· WIRED· 22 de jun. de 2026· mês passado■

Alguns Eletricistas Acreditam que Construir Data Centers é para Traidores

A Big Tech está investindo grandes somas de dinheiro em expansões de data centers. À medida que a oposição nacional às instalações aumenta, alguns trabalhadores começam a questionar se isso vale a pena.

Infraestrutura· MarkTechPost· 20 de jun. de 2026· mês passado■

Como Construir uma Pipeline de Previsão com TimeCopilot Usando Modelos de Fundação e Detecção Automática de Anomalias

Construímos um fluxo de trabalho de previsão completo com TimeCopilot em um painel de dados reais de passageiros de companhias aéreas e uma série sazonal sintética com anomalias injetadas. Avaliamos estatísticas, fundamentos e opções de GPU...

Infraestrutura· TechCrunch· 19 de jun. de 2026· mês passado▼

Os EUA dizem que a ferramenta de chip de topo da ASML pode estar na China. A ASML diz que não

Existe uma lógica comercial que vai contra a ideia de que a ASML arriscaria sua licença de exportação para armazenar um cliente chinês.

Infraestrutura· AWS ML· 19 de jun. de 2026· mês passado■

Monitorar e depurar inferência de IA gerativa com métricas detalhadas do SageMaker e painel de Insights no CloudWatch

Amazon SageMaker AI oferece hospedagem de inferência em tempo real gerenciada completamente para modelos de aprendizado de máquina. Você implantar um modelo em um endpoint do SageMaker apoiado por uma ou mais instâncias de computação, e o SageMaker lida com a provisão…

Infraestrutura· NVIDIA· 18 de jun. de 2026· mês passado■

Sincronização e Stream: GeForce NOW conecta às bibliotecas de jogos dos membros em todos os dispositivos

Jogue títulos favoritos de bibliotecas de jogos populares, mantenha o progresso sincronizado e volte às sessões de jogo em praticamente qualquer dispositivo. Isso é o poder do GeForce NOW, cloud gaming. Desde fornecer acesso aos favoritos dos membros...

Infraestrutura· IEEE Spectrum· 18 de jun. de 2026· mês passado■

Ondas Sonoras Dão aos Chips Neuromorficos uma Borda Simulando o Cérebro

Simulando como o cérebro opera, a computação neuromórfica pode usar significativamente menos energia do que os chips de IA eletrônicos convencionais. No entanto, mesmo os dispositivos neuromórficos mais sofisticados de hoje ainda são bem simples,...

Infraestrutura· NVIDIA· 18 de jun. de 2026· mês passado■

França avança no futuro da IA da Europa com tecnologias da NVIDIA

Um ano atrás, no NVIDIA GTC Paris durante o VivaTech, a França apresentou planos para avançar na IA local — desde novas fábricas de IA e capacidade de computação nacional até modelos de fronteira abertos e plataformas industriais. Agora, essa infraestrutura de IA...

Infraestrutura· TechCrunch· 18 de jun. de 2026· mês passado■

Tiffany Luck da NEA diz que as empresas ainda estão descobrindo seu ROI em IA

Tokenmaxxing foi a maior tendência em Silicon Valley no início deste ano, com CEOs encorajando funcionários a empregar a IA tanto quanto possível. Então, a conta veio. A Uber teria esgotado seu orçamento anual em IA, de acordo com relatos.

Infraestrutura· TechCrunch· 18 de jun. de 2026· mês passado■

NEA’s Tiffany Luck sobre IPOs de IA, agentes pessoais e o recalculo do ROI

Tokenmaxxing foi a tendência mais quente em Silicon Valley no início deste ano, com CEOs incentivando funcionários a empurrar o uso da IA tanto quanto possível. Então, a conta veio. A Uber teria esgotado seu orçamento anual de IA...

Infraestrutura· Ars Technica· 17 de jun. de 2026· mês passado■

Anthropic "pausa" a cobrança baseada em tokens para seu Claude Agent SDK

A mudança originalmente planejada para segunda-feira teria aumentado significativamente os custos dos usuários poderosos.

Infraestrutura· AWS ML· 17 de jun. de 2026· mês passado▲

Introduzindo cache de contêiner no Amazon SageMaker AI para escalonamento de modelos mais rápido

Hoje, estamos entusiasmados em anunciar o cache de imagens de contêiner para a inferência do Amazon SageMaker AI, o próximo grande avanço em nossa jornada de otimização de escalonamento mais rápido. Isso acelera a latência de ponta a ponta em até 2x para genera…

Infraestrutura· The Verge· 17 de jun. de 2026· mês passado▲

A mais recente chip da Qualcomm sugere que óculos inteligentes mais poderosos podem estar a caminho

Os óculos inteligentes ainda são uma categoria emergente, mas a fabricante de chips Qualcomm está intensamente trabalhando na melhoria do silício para alimentar a próxima onda de dispositivos XR: o Snapdragon Reality Elite. Embora a Qualcomm esteja anunciando o chip hoje…

Infraestrutura· TechCrunch· 16 de jun. de 2026· mês passado■

O DOJ afirma que as turbinas a gás não autorizadas da xAI são uma questão de ‘segurança nacional, econômica e energética’

O Departamento de Justiça diz que o Pentágono precisa continuar usando suas turbinas a gás não autorizadas.

Infraestrutura· WIRED· 16 de jun. de 2026· mês passado■

Uso de tokens ‘muito louco’ está testando a aposta dos chefes na IA

Um fabricante de software de Silicon Valley e uma empresa de comércio eletrônico revelam ao WIRED como estão navegando o desafio emergente de “tokenômica”.

Infraestrutura· MIT Tech Review· 16 de jun. de 2026· mês passado■

Quer rapidamente levar um centro de dados online? Dê a ele um pouco de flexibilidade

No final de uma primeira metade tensa e sem gols de um jogo de futebol entre a equipe inglesa e a rival Alemanha, milhões de britânicos soltaram um suspiro coletivo e fizeram o que costumam fazer em momentos de estresse: eles...

Infraestrutura· The Verge· 15 de jun. de 2026· mês passado▲

CEO da Skydio, Adam Bry, sobre por que Silicon Valley não deve traçar linhas vermelhas para o uso de drones

Hoje, estou falando com Adam Bry, CEO da Skydio, a principal fabricante dos EUA de drones autônomos. Antes de gravarmos este episódio, eu realmente pude operar remotamente um dos drones da Skydio na área da Baía a partir do laptop de Adam...

Infraestrutura· The Decoder· 14 de jun. de 2026· mês passado■

O Mirage da Research da Microsoft oferece à geração de vídeo uma memória espacial persistente que não esquece o que está ao redor da esquina

Mirage, um modelo de mundo de vídeo da Research da Microsoft e várias universidades, armazena informações de cena diretamente no espaço latente em vez de nuvens de pontos baseadas em pixels. Isso corta o tempo de computação e a memória gráfica...

Infraestrutura· Ars Technica· 13 de jun. de 2026· há 2 meses▼

Quando se trata do uso total de água, os data centers de IA são uma gota no oceano

Mesmo data centers de tamanho moderado podem ter um impacto local descomunal.

Infraestrutura· The Decoder· 10 de jun. de 2026· há 2 meses■

OpenAI quer seu maior data center até agora, e a Nvidia apoiaria a conta

A OpenAI está negociando o aluguel de um data center planejado de 10 gigawatts em Ohio que poderia ser apoiado financeiramente pela Nvidia, de acordo com The Information. O artigo OpenAI quer seu maior data center até agora, e a Nvidia seria…

Infraestrutura· WIRED· 10 de jun. de 2026· há 2 meses■

China abre o primeiro centro de dados subaquático movido a energia eólica do mundo

Com capacidade inicial de 24 megawatts, o inovador data center utiliza água do mar como sistema de resfriamento natural.

Infraestrutura· OpenAI· 10 de jun. de 2026· há 2 meses■

As operações de influência ligadas à RPC têm como alvo os debates sobre IA nos EUA

Um novo relatório da OpenAI detalha as operações de influência ligadas à RPC usando IA para atingir debates tecnológicos nos EUA, narrativas de data centers, tarifas e falsas alegações sobre ChatGPT.

Infraestrutura· IEEE Spectrum· 10 de jun. de 2026· há 2 meses▼

O truque de temporização reduz a energia usada no treinamento LLM em até 14 por cento

O quarto grande modelo de linguagem (LLM) da OpenAI, GPT-4, levou cerca de 50 gigawatts-hora para ser treinado, ou o equivalente ao consumo anual de energia de 5.000 lares americanos. Isso foi em 2023. Desde então, o recurso computacional…

Infraestrutura· TechCrunch· 10 de jun. de 2026· há 2 meses▲

Meta assina primeiro acordo de data center de IA na Índia com a Reliance

A instalação de 168 megawatts apoiará as necessidades globais de computação de IA da Meta e poderá ser expandida ao longo do tempo.

Infraestrutura· NVIDIA· 10 de jun. de 2026· há 2 meses■

NVIDIA Confidential Computing ajudará a expandir a computação em nuvem privada da Apple

As GPUs NVIDIA com computação confidencial agora são usadas para inferência confidencial na computação em nuvem privada (PCC) da Apple, à medida que ela se expande além dos data centers da Apple para o Google Cloud. Revelado durante o encontro anual WWDC da Apple…

Infraestrutura· The Verge· 10 de jun. de 2026· há 2 meses■

GM acredita que os EVs podem ajudar a compensar o consumo de energia da IA com tecnologia de veículo para rede

Num evento hoje em São Francisco, a General Motors fez uma série de anúncios sobre baterias EV, armazenamento de energia e resiliência da rede face à crescente procura de electricidade dos centros de dados de IA. A montadora e…

Infraestrutura· AWS ML· 10 de jun. de 2026· há 2 meses■

Dimensione o aprendizado de reforço de robôs com NVIDIA Isaac Lab no Amazon SageMaker AI

Nesta postagem, mostramos como treinar políticas de robô para o humanóide Unitree H1 com NVIDIA Isaac Lab no Amazon SageMaker AI em duas opções de computação: Amazon SageMaker HyperPod e Amazon SageMaker Training Jobs.

Infraestrutura· The Verge· 9 de jun. de 2026· há 2 meses■

Funcionários da Amazon pedem a Seattle para frear novos data centers

Na terça-feira, o Conselho Municipal de Seattle votará sobre a possibilidade de promulgar uma moratória de um ano sobre novos data centers – apenas dois meses depois de várias empresas terem proposto a construção de cinco centros de grande escala na cidade. Entre os mo…

Infraestrutura· OpenAI· 9 de jun. de 2026· há 2 meses■

O que o Codex desbloqueia para o Notion

Como o Notion usa o Codex para especificações únicas, cria entrada de voz de IA para a web e multiplica o poder de engenharia em pequenas equipes.

Infraestrutura· MarkTechPost· 9 de jun. de 2026· há 2 meses▼

Tutorial NVIDIA cuTile Python: Construindo kernels de GPU lado a lado para adição de vetores, adição de matrizes e multiplicação de matrizes no Colab

Neste tutorial, implementamos um fluxo de trabalho prático para NVIDIA cuTile Python, uma interface de programação de GPU baseada em blocos para kernels estilo CUDA em Python. Preparamos um ambiente amigável ao Colab e verificamos GPU, driver, CUDA,…

Infraestrutura· The Decoder· 9 de jun. de 2026· há 2 meses▲

A Intel ganha uma segunda vida à medida que o Google e a Nvidia a exploram como um backup da TSMC para chips de IA

O Google encomendou mais de três milhões de chips de IA da Intel para 2028. A Nvidia está testando a tecnologia de fabricação da Intel para sua próxima arquitetura Feynman. Ambos os movimentos ocorrem porque a TSMC não consegue acompanhar a demanda de chips de IA. Internacional…

Infraestrutura· MarkTechPost· 9 de jun. de 2026· há 2 meses▲

Xiaomi MiMo e TileRT impulsionam um modelo de 1 trilhão de parâmetros além de 1.000 tokens por segundo em GPUs de commodities

A equipe MiMo da Xiaomi, com TileRT, lançou o MiMo-V2.5-Pro-UltraSpeed, um modo de serviço para o modelo MiMo-V2.5-Pro. Ele decodifica mais de 1.000 tokens por segundo em um modelo de 1 trilhão de parâmetros usando um único nó de commodity de 8 GPU.…

Infraestrutura· AWS ML· 9 de jun. de 2026· há 2 meses■

Desbloquear a flexibilidade da IA na Europa: um guia para inferência entre regiões para processamento de dados e acesso a modelos na UE

Com acesso aos mais recentes modelos de IA generativa e computação acelerada de alto desempenho em alta demanda global, os clientes da AWS precisam de ferramentas para aproveitar a disponibilidade e a capacidade do modelo em diversas regiões da AWS, com…

Infraestrutura· NVIDIA· 8 de jun. de 2026· há 2 meses▲

NVIDIA e LG Group constroem uma fábrica de IA para desenvolver IA física, mobilidade e infraestrutura de IA

A NVIDIA e o Grupo LG estão construindo uma fábrica de IA para acelerar a próxima onda de negócios orientados por IA do Grupo LG, abrangendo robótica, direção autônoma, tecnologias de data center e serviços de GPU em nuvem. A fábrica de IA irá fornecer…

Infraestrutura· The Decoder· 7 de jun. de 2026· há 2 meses■

Anthropic caça o segundo engenheiro de chips da OpenAI enquanto ambas as empresas correm em direção a IPOs

Clive Chan, segundo seu próprio relato, o segundo funcionário de hardware no programa de chips personalizados da OpenAI, está se mudando para a Anthropic. Ele traz experiência do Autopilot ASIC da Tesla e da parceria OpenAI-Broadcom. A mudança vem um…

Infraestrutura· MarkTechPost· 7 de jun. de 2026· há 2 meses▲

A nova CLI do Colab do Google permite que desenvolvedores e agentes de IA executem Python em GPUs e TPUs Colab remotos a partir do terminal

O Google lançou o Colab CLI, permitindo que desenvolvedores e agentes de IA executem código local em GPU Colab remoto e tempo de execução TPU The post O novo Colab CLI do Google permite que desenvolvedores e agentes de IA executem Python em GPUs e TPUs Colab remotos F…

Infraestrutura· The Decoder· 6 de jun. de 2026· há 2 meses▲

Sakana AI aposta que a IA que se aprimora pode quebrar a corrida armamentista computacional dos laboratórios de fronteira

Sakana AI lançou um laboratório de pesquisa dedicado para autoaperfeiçoamento recursivo: IA que se aprimora iterativamente. A startup japonesa, cofundada pelo coautor do Transformer, Llion Jones, vê o RSI como uma alternativa para…

Infraestrutura· Ars Technica· 6 de jun. de 2026· há 2 meses▼

“Irritamos muita gente”: plano de data center gigante foi cortado em 50% em meio a protestos

O desenvolvedor se sentiu "espancado", sem "nenhuma escolha" a não ser reduzir o data center.

Infraestrutura· MarkTechPost· 5 de jun. de 2026· há 2 meses▲

NVIDIA AI lança Nemotron 3 Ultra: um transformador Mamba híbrido aberto de 550B com mistura de especialistas para agentes de longa duração

A NVIDIA lançou o Nemotron 3 Ultra, um Mamba-Transformer híbrido aberto de mistura de especialistas com capacidade total de 550B (55B ativos) para agentes de longa duração. Ele emparelha um contexto de token de 1 milhão com uma taxa de transferência de inferência até ~ 6x maior do que a compa…

Infraestrutura· TechCrunch· 5 de jun. de 2026· há 2 meses■

Meta rouba tática da Tesla e constrói data centers em tendas

A Meta pode ter encontrado uma maneira de reduzir sua enorme conta de data center: tendas.

Infraestrutura· The Verge· 5 de jun. de 2026· há 2 meses▼

Kevin O’Leary concorda em reduzir o enorme data center de Utah

Kevin O'Leary concordou em reduzir pela metade o tamanho de seu data center planejado de 40.000 acres em Utah em meio à crescente pressão de residentes e ativistas, conforme relatado anteriormente pela afiliada local ABC4. A estrela de Shark Tank enviou uma carta para…

Infraestrutura· TechCrunch· 4 de jun. de 2026· há 2 meses▲

O Vale do Silício está pronto para colocar robôs nas casas das pessoas? Olá, Robô é.

A startup da Califórnia lançou a quarta geração de seu robô de assistência domiciliar, Stretch.

Infraestrutura· Ars Technica· 4 de jun. de 2026· há 2 meses■

Como alguns operadores de data centers estão lidando com seus problemas de uso de água

Os hiperscaladores estão sob escrutínio quanto ao seu impacto na qualidade e disponibilidade da água.

Infraestrutura· IEEE Spectrum· 4 de jun. de 2026· há 2 meses▲

Os avanços clássicos necessários para fazer os computadores quânticos funcionarem

Os computadores quânticos prometem um dia resolver problemas que vão além dos supercomputadores mais poderosos que se possa imaginar. Mas muitas vezes é subestimado o quanto de computação clássica é necessária apenas para operar essas máquinas. Como contagem de qubit…

Infraestrutura· HotON Desk· 3 de jun. de 2026· há 2 meses▼

A capacidade regional da GPU diminui à medida que novos clusters ficam online

A nova capacidade do data center em diversas regiões facilitou a disponibilidade da GPU, ajudando a reduzir os índices de custos de inferência regionais esta semana.

Infraestrutura· HotON Desk· 1 de jun. de 2026· há 2 meses■

Preços de computação vinculados à energia são lançados em mais duas regiões

Mais provedores estão vinculando os preços de computação às condições locais de energia, adicionando uma dimensão de hora do dia para onde e quando as cargas de trabalho de IA são mais baratas.

Infraestrutura· NVIDIA· 1 de jun. de 2026· há 2 meses▲

Ecossistema de nuvem de IA da NVIDIA se expande mundialmente para atender à demanda global de computação por IA

O ecossistema NVIDIA AI Cloud está acelerando a construção global da infraestrutura de fábrica de IA. Os parceiros estão expandindo a capacidade para atender à crescente demanda de empresas, startups, nações, laboratórios de IA e desenvolvedores em expansão...

Infraestrutura· VentureBeat· 12 de jan. de 2026· há 7 meses▲

Anthropic lança Cowork, um agente Claude Desktop que trabalha em seus arquivos — sem necessidade de codificação

A Anthropic lançou o Cowork na segunda-feira, um novo recurso de agente de IA que estende o poder de sua ferramenta Claude Code de grande sucesso para usuários não técnicos – e de acordo com membros da empresa, a equipe construiu todo o recurso…

Os resumos são agregados apenas para fins informativos – siga o link da fonte para ver a história completa. As entradas de demonstração são ilustrativas.