컴퓨팅 공급, GPU, 데이터 센터 및 에너지는 AI 실행 비용을 결정하는 물리적 계층입니다.
28 스토리
컴퓨팅 공급, 에너지 및 데이터 센터 용량은 AI를 얼마나 저렴하게 실행할 수 있는지를 결정합니다. 인프라 변화는 몇 주 후에 추론 비용에 나타납니다.
중간 규모의 데이터 센터라도 지역적으로 큰 영향을 미칠 수 있습니다.
The Information에 따르면 OpenAI는 Nvidia의 재정적 지원을 받을 수 있는 오하이오에 계획된 10기가와트 규모의 데이터 센터 임대 협상을 진행 중입니다. 기사 OpenAI는 사상 최대 규모의 데이터 센터를 원하며 Nvidia는…
초기 용량이 24메가와트인 혁신적인 데이터 센터는 해수를 자연 냉각 시스템으로 사용합니다.
OpenAI의 새로운 보고서는 미국 기술 토론, 데이터 센터 설명, 관세 및 ChatGPT에 대한 허위 주장을 표적으로 삼기 위해 AI를 사용하는 중국과 연계된 영향력 작전을 자세히 설명합니다.
168메가와트 규모의 시설은 Meta의 글로벌 AI 컴퓨팅 요구 사항을 지원하며 시간이 지남에 따라 확장될 수 있습니다.
기밀 컴퓨팅 기능을 갖춘 NVIDIA GPU는 Apple의 데이터 센터를 넘어 Google Cloud로 확장됨에 따라 이제 Apple의 PCC(Private Cloud Compute)에서 기밀 추론에 사용됩니다. Apple의 연례 WWDC 행사에서 공개되었습니다…
오늘 샌프란시스코에서 열린 행사에서 General Motors는 AI 데이터 센터의 전력 수요 증가에 직면하여 EV 배터리, 에너지 저장 및 그리드 탄력성에 관한 일련의 발표를 했습니다. 자동차 제조사는…
이 게시물에서는 Amazon SageMaker HyperPod와 Amazon SageMaker 훈련 작업이라는 두 가지 컴퓨팅 옵션을 통해 Amazon SageMaker AI에서 NVIDIA Isaac Lab을 사용하여 Unitree H1 휴머노이드에 대한 로봇 정책을 훈련하는 방법을 보여줍니다.
Notion이 Codex를 사용하여 일회성 사양을 만들고, 웹용 AI 음성 입력을 구축하고, 소규모 팀 전체에 엔지니어링 역량을 배가하는 방법입니다.
화요일, 시애틀 시의회는 새로운 데이터 센터에 대한 1년 유예를 제정할지 여부를 투표할 예정입니다. 이는 여러 회사가 도시에 5개의 대규모 센터를 건설할 것을 제안한 지 불과 두 달 만입니다. 그중에…
이 튜토리얼에서는 Python의 CUDA 스타일 커널을 위한 타일 기반 GPU 프로그래밍 인터페이스인 NVIDIA cuTile Python에 대한 실습 워크플로를 구현합니다. Colab 친화적인 환경을 준비하고 GPU, 드라이버, CUDA,…
Google은 2028년에 Intel에 300만 개 이상의 AI 칩을 주문했습니다. Nvidia는 곧 출시될 Feynman 아키텍처를 위해 Intel의 제조 기술을 테스트하고 있습니다. 두 가지 움직임 모두 TSMC가 AI 칩 수요를 따라잡을 수 없기 때문에 나온 것입니다. 국제…
Xiaomi의 MiMo 팀은 TileRT와 함께 MiMo-V2.5-Pro 모델용 서비스 모드인 MiMo-V2.5-Pro-UltraSpeed를 출시했습니다. 단일 8GPU 상용 노드를 사용하여 1조 매개변수 모델에서 초당 1000개가 넘는 토큰을 디코딩합니다.…
전 세계적으로 높은 수요가 있는 최신 생성 AI 모델과 고성능 가속 컴퓨팅에 액세스할 수 있는 AWS 고객은 여러 AWS 리전에서 모델 가용성과 용량을 활용할 수 있는 도구가 필요합니다.
엔비디아와 LG그룹은 로봇공학, 자율주행, 데이터센터 기술, GPU 클라우드 서비스 등 LG그룹의 차세대 AI 기반 사업을 가속화하기 위해 AI 공장을 건설하고 있습니다. AI공장이 증명할 것…
OpenAI 맞춤형 칩 프로그램의 두 번째 하드웨어 직원인 Clive Chan이 Anthropic으로 이전하고 있습니다. 그는 Tesla의 Autopilot ASIC 및 OpenAI-Broadcom 파트너십 경험을 제공합니다. 이번 조치는…
Google은 개발자와 AI 에이전트가 원격 Colab GPU 및 TPU 런타임에서 로컬 코드를 실행할 수 있는 Colab CLI를 출시했습니다. Google의 새로운 Colab CLI를 통해 개발자와 AI 에이전트는 원격 Colab GPU 및 TPU에서 Python을 실행할 수 있습니다.
Sakana AI has launched a dedicated research lab for recursive self-improvement: AI that iteratively improves itself. The Japanese startup, co-founded by Transformer co-author Llion Jones, sees RSI as an alternative to t…
Developer felt "beaten up," with "no choice" but to shrink data center.
NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Meta may have found one way to slash its massive data center bill: tents.
Kevin O'Leary agreed to halve the size of his planned 40,000-acre data center in Utah amid mounting pressure from residents and activists, as reported earlier by local affiliate ABC4. The Shark Tank star sent a letter t…
The California startup released the fourth-generation of its home assistance robot, Stretch.
Hyperscalers have come under scrutiny for their impact on water quality and availability.
Fresh data-center capacity in several regions eased GPU availability, helping push regional inference cost indices lower this week.
More providers are tying compute prices to local energy conditions, adding a time-of-day dimension to where and when AI workloads run cheapest.
The NVIDIA AI Cloud ecosystem is accelerating the global buildout of AI factory infrastructure. Partners are expanding capacity to meet growing demand from enterprises, startups, nations, AI labs and developers scaling…
Anthropic released Cowork on Monday, a new AI agent capability that extends the power of its wildly successful Claude Code tool to non-technical users — and according to company insiders, the team built the entire featu…
요약은 정보 제공 목적으로만 집계되었습니다. 전체 내용을 보려면 소스 링크를 따르세요. 데모 항목은 예시입니다.