Rechenleistung, GPUs, Rechenzentren und Energie – die physische Schicht, die darüber entscheidet, wie kostengünstig KI läuft.
28-Geschichten
Rechenleistung, Energie und Rechenzentrumskapazität entscheiden darüber, wie kostengünstig KI betrieben werden kann. Infrastrukturverschiebungen zeigen sich Wochen später in den Inferenzkosten.
Selbst Rechenzentren mittlerer Größe können eine übergroße lokale Auswirkung haben.
Laut The Information verhandelt OpenAI über die Anmietung eines geplanten 10-Gigawatt-Rechenzentrums in Ohio, das von Nvidia finanziell unterstützt werden könnte. Der Artikel OpenAI will sein bisher größtes Rechenzentrum und Nvidia würde …
Mit einer anfänglichen Kapazität von 24 Megawatt nutzt das innovative Rechenzentrum Meerwasser als natürliches Kühlsystem.
In einem neuen Bericht von OpenAI werden Einflussoperationen im Zusammenhang mit der Volksrepublik China detailliert beschrieben, bei denen KI zum Einsatz kommt, um US-Technologiedebatten, Narrative über Rechenzentren, Zölle und falsche Behauptungen über ChatGPT ins Visier zu nehmen.
Die 168-Megawatt-Anlage wird Metas weltweiten Bedarf an KI-Computing decken und kann im Laufe der Zeit erweitert werden.
NVIDIA-GPUs mit Confidential Computing werden jetzt für vertrauliche Schlussfolgerungen in Apples Private Cloud Compute (PCC) verwendet, da es über die Rechenzentren von Apple hinaus auf Google Cloud ausgeweitet wird. Enthüllt während Apples jährlichem WWDC-Treffen …
Auf einer Veranstaltung in San Francisco machte General Motors heute eine Reihe von Ankündigungen zu den Themen EV-Batterien, Energiespeicherung und Netzstabilität angesichts der wachsenden Stromnachfrage aus KI-Rechenzentren. Der Autohersteller und…
In diesem Beitrag zeigen wir, wie Sie Roboterrichtlinien für den Humanoiden Unitree H1 mit NVIDIA Isaac Lab auf Amazon SageMaker AI über zwei Rechenoptionen trainieren: Amazon SageMaker HyperPod und Amazon SageMaker Training Jobs.
Wie Notion Codex nutzt, um One-Shot-Spezifikationen zu erstellen, KI-Spracheingaben für das Web zu erstellen und die technische Leistung in kleinen Teams zu vervielfachen.
Am Dienstag wird der Stadtrat von Seattle darüber abstimmen, ob ein einjähriges Moratorium für neue Rechenzentren erlassen werden soll – nur zwei Monate nachdem mehrere Unternehmen den Bau von fünf großen Zentren in der Stadt vorgeschlagen hatten. Unter den Mo…
In diesem Tutorial implementieren wir einen praktischen Workflow für NVIDIA cuTile Python, eine kachelbasierte GPU-Programmierschnittstelle für Kernel im CUDA-Stil in Python. Wir bereiten eine Colab-freundliche Umgebung vor und überprüfen GPU, Treiber, CUDA usw.
Google hat für 2028 mehr als drei Millionen KI-Chips bei Intel bestellt. Nvidia testet Intels Fertigungstechnologie für seine kommende Feynman-Architektur. Beide Schritte erfolgen, da TSMC mit der Nachfrage nach KI-Chips nicht Schritt halten kann. Int…
Das MiMo-Team von Xiaomi hat mit TileRT MiMo-V2.5-Pro-UltraSpeed veröffentlicht, einen Serviermodus für das MiMo-V2.5-Pro-Modell. Es dekodiert über 1000 Token pro Sekunde auf einem 1-Billion-Parameter-Modell unter Verwendung eines einzigen 8-GPU-Commodity-Knotens.…
Da der Zugriff auf die neuesten generativen KI-Modelle und hochleistungsfähige beschleunigte Berechnungen weltweit stark nachgefragt werden, benötigen AWS-Kunden Tools, um die Modellverfügbarkeit und -kapazität in mehreren AWS-Regionen zu nutzen.
NVIDIA und die LG Group bauen eine KI-Fabrik, um die nächste Welle von KI-gesteuerten Unternehmen der LG Group zu beschleunigen, die Robotik, autonomes Fahren, Rechenzentrumstechnologien und GPU-Cloud-Dienste umfassen. Die KI-Fabrik wird beweisen…
Clive Chan, nach eigenen Angaben der zweite Hardware-Mitarbeiter im Custom-Chip-Programm von OpenAI, wechselt zu Anthropic. Er bringt Erfahrungen aus Teslas Autopilot ASIC und der OpenAI-Broadcom-Partnerschaft mit. Der Umzug kommt…
Google hat die Colab-CLI veröffentlicht, mit der Entwickler und KI-Agenten lokalen Code auf der Remote-GPU und TPU-Laufzeit von Colab ausführen können. Der Beitrag Die neue Colab-CLI von Google ermöglicht es Entwicklern und KI-Agenten, Python auf Remote-GPUs und TPUs von Colab auszuführen.
Sakana AI has launched a dedicated research lab for recursive self-improvement: AI that iteratively improves itself. The Japanese startup, co-founded by Transformer co-author Llion Jones, sees RSI as an alternative to t…
Developer felt "beaten up," with "no choice" but to shrink data center.
NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Meta may have found one way to slash its massive data center bill: tents.
Kevin O'Leary agreed to halve the size of his planned 40,000-acre data center in Utah amid mounting pressure from residents and activists, as reported earlier by local affiliate ABC4. The Shark Tank star sent a letter t…
The California startup released the fourth-generation of its home assistance robot, Stretch.
Hyperscalers have come under scrutiny for their impact on water quality and availability.
Fresh data-center capacity in several regions eased GPU availability, helping push regional inference cost indices lower this week.
More providers are tying compute prices to local energy conditions, adding a time-of-day dimension to where and when AI workloads run cheapest.
The NVIDIA AI Cloud ecosystem is accelerating the global buildout of AI factory infrastructure. Partners are expanding capacity to meet growing demand from enterprises, startups, nations, AI labs and developers scaling…
Anthropic released Cowork on Monday, a new AI agent capability that extends the power of its wildly successful Claude Code tool to non-technical users — and according to company insiders, the team built the entire featu…
Zusammenfassungen werden nur zu Informationszwecken aggregiert – folgen Sie dem Quelllink für die vollständige Geschichte. Demo-Einträge dienen der Veranschaulichung.