Infrastruktur

KI-Infrastruktur

Rechenleistung, GPUs, Rechenzentren und Energie – die physische Schicht, die darüber entscheidet, wie kostengünstig KI läuft.

190-Geschichten

Alle Neuigkeiten Modelleinführungen Preise Infrastruktur Politik Finanzierung & M&A Open Source

Warum es wichtig ist

Rechenleistung, Energie und Rechenzentrumskapazität entscheiden darüber, wie kostengünstig KI betrieben werden kann. Infrastrukturverschiebungen zeigen sich Wochen später in den Inferenzkosten.

Infrastruktur· WIRED· 29. Juli 2026· vor 3 Stunden■

Mehr Tippfehler, weniger Bindestriche: Autoren schaffen eine Anti-KI-„literarische Gegenkultur“

Romanautoren, Journalisten und prominente LinkedIn-Poster nutzen Ich-Erzählungen und Eigenheiten, um nicht mit Chatbots verwechselt zu werden.

Infrastruktur· Hacker News· 29. Juli 2026· vor 20 Stunden■

Chip-Aktien fallen, da der KI-Ausverkauf zunimmt

Artikel-URL: https://www.ft.com/content/f8c03b5b-e194-4236-82c3-389b6f5dd7ae Kommentar-URL: https://news.ycombinator.com/item?id=49087537 Punkte: 34 # Kommentare: 5

Infrastruktur· TechCrunch· 28. Juli 2026· vor 22 Stunden▼

Rechenzentren könnten mit vorübergehenden Stromausfällen rechnen, um Stromausfälle im größten US-Netz zu verhindern

Die Entscheidung fällt zu einem Zeitpunkt, zu dem Netzbetreiber aufgrund des rasanten Tempos beim Bau von Rechenzentren darum kämpfen, Strom zu erzeugen.

Infrastruktur· The Decoder· 28. Juli 2026· gestern▼

Taiwan nimmt Nvidia-Mitarbeiter fest, weil Ermittlungen zum Chipschmuggel in China ausgeweitet werden

Laut Bloomberg und Reuters haben Taiwans Staatsanwälte einen Nvidia-Mitarbeiter im Zusammenhang mit dem angeblich illegalen Export von Super Micro AI-Servern nach China festgenommen. Der Artikel Taiwan hält Nvidia-Mitarbeiter fest

Infrastruktur· ZDNet· 28. Juli 2026· gestern■

Sie haben Ihre Powerbank falsch verwendet, und die Regeln der Fluggesellschaft machen das offensichtlich

Viele der Dinge, die Sie in einem Flugzeug nicht tun dürfen, sollten Sie überhaupt nicht tun.

Infrastruktur· MIT Tech Review· 28. Juli 2026· gestern■

Die Chip-Hersteller von Samsung springen zum Rivalen SK Hynix

Lee, ein Ingenieur in der Halbleiterabteilung von Samsung, stempelt ab, wenn seine Schicht zu Ende ist. Früher arbeitete er länger und ging die Extrameile, um bei seinen Projekten hervorragende Leistungen zu erbringen. Aber in letzter Zeit kommt er direkt nach Hause, um an ihm zu arbeiten …

Infrastruktur· AI News· 28. Juli 2026· gestern■

Armeniens KI-Wette ist keine Chip-Herstellung. Es ist Rechensouveränität

Armenien ist kein großes Land. Es ist kein wohlhabendes Land. Es ist kein berühmtes Land. Und doch ist es nicht nur zum Verbraucher verschiedener KI-Produkte wie dem Clideo-Untertitelgenerator für die Videobearbeitung oder von Giganten wie … geworden.

Infrastruktur· The Verge· 28. Juli 2026· vorgestern▲

Warum China seine besten KI-Modelle verschenkt

Besucher besuchen den Stand von Kimi, einem LLM, das vom chinesischen Startup Moonshot entwickelt wurde, während der World AI Conference in Shanghai, China, am 20. Juli. | Bild: LONG WEI/ Feature China/Future Publishing über Getty Images Silicon…

Infrastruktur· TechCrunch· 27. Juli 2026· vorgestern▲

Stärken Sie Ihre KI-Infrastruktur! Ein erster Blick auf die Agenda der Smart Systems Stage bei TechCrunch Disrupt 2026

Bei TechCrunch Disrupt 2026 wird die Smart Systems Stage der Ort sein, an dem Energie, Infrastruktur und Technologie aufeinandertreffen und alles von Fusionsdurchbrüchen bis hin zur Netzbelastung, die KI für die gesamte Wirtschaft darstellt, abgedeckt wird.

Infrastruktur· ZDNet· 27. Juli 2026· vorgestern■

Wie würden KI-Rechenzentren im Weltraum überhaupt funktionieren? Ein ehemaliger Robotikchef der NASA erklärt

„Man sammelt Elektrizität im Weltraum und gibt Wärme im Weltraum ab.“ „Das Einzige, was auf die Erde kommt, sind Daten.“

Infrastruktur· NVIDIA· 27. Juli 2026· vor 3 Tagen▲

NVIDIA nutzt die Vera-CPU, um das Design von CPUs und GPUs der nächsten Generation zu beschleunigen

Die Komplexität des modernen Chipdesigns nimmt weiter zu, da Ingenieurteams an der Entwicklung immer anspruchsvollerer CPUs, GPUs und KI-Systeme arbeiten. Um dieser Herausforderung gerecht zu werden, arbeitet NVIDIA mit Branchenführern zusammen …

Infrastruktur· TechCrunch· 27. Juli 2026· vor 3 Tagen■

Die Panik über chinesische KI verstehen

In der neuesten Folge von Equity diskutierten wir darüber, warum Kimi von Moonshot AI das Silicon Valley und die Wall Street in Panik zu versetzen schien.

Infrastruktur· MarkTechPost· 26. Juli 2026· vor 4 Tagen■

Entwerfen leistungsstarker GPU-Kernel mit TileLang: Tensor-Core GEMM, Fused Softmax, FlashAttention und Autotuning

Entdecken Sie TileLang, eine domänenspezifische High-Level-Python-Sprache, die das Design von Hochleistungs-GPU-Kerneln vereinfacht. Dieses Tutorial bietet einen schrittweisen Ansatz zur Implementierung komplexer Workloads – einschließlich gekachelter…

Infrastruktur· TechCrunch· 25. Juli 2026· vor 4 Tagen▲

Eine heruntergefallene Stromleitung offenbarte ein wachsendes Problem im KI-Rechenzentrum. Hier erfahren Sie, wie Sie das Problem beheben können.

Ein genauer Anruf in Nord-Virginia zeigte, wie schlecht Rechenzentren auf Netzstörungen reagieren. Hier erfahren Sie, wie Sie das Problem beheben können.

Infrastruktur· ZDNet· 25. Juli 2026· vor 4 Tagen■

Samsungs neues Galaxy Z Fold 8 Ultra ist beeindruckend, aber es ist nicht das Flaggschiff, das mich anzieht

Das Samsung Galaxy Z Fold 8 Ultra ist ein gutes Telefon, aber das Galaxy Z Fold 8 hat etwas viel Überzeugenderes.

Infrastruktur· ZDNet· 25. Juli 2026· vor 4 Tagen■

Samsung Galaxy Z Fold 8 Ultra vs. Z Fold 7: Nach einem Jahr Nutzung bin ich bereit für ein Upgrade

Mit dem neuesten faltbaren Telefon von Samsung bietet das Unternehmen Design- und Softwareänderungen an, die selbst das letztjährige Z Fold als unzureichend erscheinen lassen.

Infrastruktur· MarkTechPost· 25. Juli 2026· vor 4 Tagen▼

Datalab Marker v2 vs. MinerU, Docling und Liteparse: Benchmark-Aufschlüsselung

Datalab hat Marker als Drei-Modus-Pipeline umgeschrieben. Version 2 erreicht 76,0 auf dem olmOCR-Bench und erreicht 2,9 Seiten pro Sekunde auf einem B200 – mehr als das Fünffache des Pipeline-Backends von MinerU, während sie Docling sowohl bei der Genauigkeit als auch bei der Geschwindigkeit übertrifft. H…

Infrastruktur· MarkTechPost· 25. Juli 2026· vor 4 Tagen■

Datalabs Marker 2 vs. MinerU, Docling und LiteParse: 76,0 auf olmOCR-Bench bei 5-fachem MinerU-Durchsatz

Infrastruktur· Hacker News· 25. Juli 2026· vor 5 Tagen▲

AMD und Cerebras bringen KI-Inferenzlösung auf den Markt

Artikel-URL: https://www.cerebras.ai/press-release/amd-and-cerebras-announce-industry-leading-ultra-low-latency-and-high-throughput-ai-inference Kommentar-URL: https://news.ycombinator.com/item?id=49041347 Punkte: 17 # C…

Infrastruktur· Ars Technica· 24. Juli 2026· vor 5 Tagen■

KI-Firmen wollen mehr Rechenzentren; Trumps EPA könnte den Nachbarn weniger Mitspracherecht einräumen

Die Regel würde es den Staaten ermöglichen, zu entscheiden, wie viel – wenn überhaupt – öffentliche Beiträge geleistet werden dürfen.

Infrastruktur· MarkTechPost· 24. Juli 2026· vor 5 Tagen■

So bauen Sie eine End-to-End-OCR-Pipeline mit Baidus Unlimited-OCR für hochauflösende Bilder und mehrseitige PDF-Analyse auf

In diesem Tutorial erstellen wir einen vollständigen Workflow für die Ausführung des Unlimited-OCR-Modells von Baidu auf Dokumentbildern und mehrseitigen PDFs. Von der Konfiguration der GPU-Umgebung bis zum Vergleich hochdetaillierter gekachelter Gundam-Inferenz und -Fas…

Infrastruktur· Hacker News· 24. Juli 2026· vor 6 Tagen■

Australien setzt auf KI: Produzieren Sie mehr Strom, als Sie verbrauchen, stoppen Sie den „Diebstahl“ von Inhalten

Artikel-URL: https://www.theregister.com/ai-and-ml/2026/07/15/australia-demands-ai-companies-must-produce-more-energy-than-they-consume-stop-theft-of-content/5271535 Kommentar-URL: https://news.ycombinator.com/item?id=49…

Infrastruktur· IEEE Spectrum· 23. Juli 2026· vor 6 Tagen■

Die NASA bringt das Gemma Large Language Model von Google in die Umlaufbahn

Die Machbarkeit orbitaler Rechenzentren, die die größten und leistungsfähigsten Large Language Models (LLMs) beherbergen, bleibt heiß umstritten. Aber enorme Bereitstellungen, die Tausende von GPUs erfordern, sind nicht die einzigen Möglichkeiten, die LLMs bieten können …

Infrastruktur· The Verge· 23. Juli 2026· vor 6 Tagen▲

Die rechten Boomer, die gegen Rechenzentren protestieren, haben viel mit den Linken gemeinsam

Eine Person hält Schilder während eines landesweiten Protests gegen die Erweiterung des KI-Rechenzentrums vor der Peace Hall in New Port Richey, Florida. | AFP über Getty Images An einem grauen, feuchten Samstagmorgen in Zentralflorida, ein wenig und…

Infrastruktur· NVIDIA· 23. Juli 2026· vor 7 Tagen▲

NVIDIA AI Supercomputer geht an der Naval Postgraduate School online

Jensen Huang, Gründer und CEO von NVIDIA, besuchte heute die Naval Postgraduate School in Monterey, Kalifornien, um ein NVIDIA DGX GB300-System in Betrieb zu nehmen und damit eine der leistungsstärksten KI-Plattformen der Welt für ... vollständig online zu bringen.

Infrastruktur· Hacker News· 22. Juli 2026· vor 7 Tagen■

Die meisten Amerikaner sagen zu KI-Rechenzentren „nicht in meinem Hinterhof“.

Artikel-URL: https://www.redfin.com/news/ai-data-centers-opposition-education-benefit/ Kommentar-URL: https://news.ycombinator.com/item?id=49007525 Punkte: 39 # Kommentare: 53

Infrastruktur· ZDNet· 22. Juli 2026· vor 7 Tagen■

Samsung Galaxy Z Fold 8 Ultra vs. Google Pixel Fold 10 Pro: Sie können nicht verlieren, aber hier ist meine Überraschungsauswahl

Das Samsung Galaxy Z Fold 8 Ultra verfügt über die nötige Leistung, aber der Preis und das Zubehör für das Google Pixel 10 Pro Fold könnten ein besseres Angebot sein.

Infrastruktur· OpenAI· 22. Juli 2026· vor 7 Tagen■

Die nächste Ära der nationalen Wissenschaft vorantreiben

OpenAI unterstreicht sein Engagement für die Weiterentwicklung der amerikanischen Wissenschaft in Zusammenarbeit mit dem US-Energieministerium und nationalen Laboren, um mithilfe von Grenz-KI die Entdeckung zu beschleunigen.

Infrastruktur· AI News· 22. Juli 2026· vor 7 Tagen▲

Das Galaxy-Projekt von SenseTime zielt auf die Skalierung inländischer KI-Chips ab

SenseTime hat das Galaxy-Projekt gestartet und arbeitet mit fast 20 Partnern zusammen, um die inländische KI-Chip-Infrastruktur in China zu skalieren. In einer Keynote mit dem Titel „Intelligente Transformation und Symbiose“ sagte Yang Fan – Mitgründer des Unternehmens …

Infrastruktur· The Verge· 22. Juli 2026· vor 7 Tagen■

Versorgungsunternehmen versprechen, uns die Energierechnung von KI zu ersparen

Das Versprechen wurde im März eingeführt und hat bisher kaum dazu beigetragen, die Bedenken auszuräumen. | Bild: Cath Virginia / The Verge, Getty Images Angesichts der Gegenreaktionen auf Bedenken wird der KI-Boom die Stromrechnungen der Verbraucher erhöhen …

Infrastruktur· TechCrunch· 22. Juli 2026· vor 8 Tagen■

Bis 2035 werden Rechenzentren voraussichtlich viermal mehr Strom verbrauchen

Neue Rechenzentren, die bis 2033 gebaut werden, könnten so viel Strom verbrauchen, wie Indien heute verbraucht.

Infrastruktur· Hacker News· 22. Juli 2026· vor 8 Tagen■

Die KI-Modelle von Meta treiben die erste Welle von Genesis-Mission-Projekten voran

https://www.energy.gov/undersecretaryforscience/genesis-miss... Kommentar-URL: https://news.ycombinator.com/item?id=48995074 Punkte: 84 # Kommentare: 56

Infrastruktur· NVIDIA· 21. Juli 2026· vor 8 Tagen■

NVIDIA Spectrum-6 wurde für Vera Rubin entwickelt und kommt in Gigascale-KI-Fabriken an

KI ist in die Gigascale-Ära eingetreten. Die fortschrittlichsten KI-Fabriken der Welt vereinen Hunderttausende GPUs und CPUs, um Grenzmodelle zu trainieren, Agenten-KI zu betreiben und Intelligenz in beispiellosem Tempo zu generieren.

Infrastruktur· WIRED· 21. Juli 2026· vor 8 Tagen■

Nvidia möchte jeden Chip in KI-Rechenzentren besitzen

Die Vera Rubin-Plattform von Nvidia vereint CPUs und GPUs in einem einzigen System und spiegelt damit den wachsenden Ehrgeiz des Unternehmens wider, jede Ebene der KI-Infrastruktur zu betreiben.

Infrastruktur· TechCrunch· 21. Juli 2026· vor 9 Tagen■

Google arbeitet an einem neuen KI-Chip, der Gemini effizienter machen soll

Alphabet, die Muttergesellschaft von Google, arbeitet Berichten zufolge an einem neuen Chip, der dafür sorgen soll, dass seine Gemini-Modelle deutlich effizienter laufen.

Infrastruktur· The Decoder· 21. Juli 2026· vor 9 Tagen▲

Berichten zufolge integriert der „Frozen v2“-Chip von Google die Gemini-Architektur direkt in Silizium, um die Effizienz zu steigern

Google entwickelt „Frozen v2“, einen Serverchip, der die Gemini-Architektur direkt in Hardware integriert. Internen Quellen zufolge könnte es 6 bis 10 Mal effizienter sein als aktuelle TPUs. Geplant für 2028, d…

Infrastruktur· AWS ML· 21. Juli 2026· vor 9 Tagen■

Wie Couchbase mit Amazon Bedrock eine Multimodell-KI-Architektur für Capella iQ erstellt hat

Dieser Beitrag beschreibt, wie Couchbase Amazon Bedrock einführte, um Capella iQ mit der Claude-Modellfamilie von Anthropic zu betreiben, die architektonischen Entscheidungen hinter ihrem Multimodell-Ansatz und die realisierten betrieblichen Vorteile …

Infrastruktur· The Decoder· 21. Juli 2026· vor 9 Tagen■

Nvidias Einfluss auf KI-Chips wird schwächer, da sich Microsoft an AMD wendet und Anthropic möglicherweise folgen wird

Microsoft erweitert die KI-Infrastruktur von Azure mit der neuen Helios-Plattform von AMD, die in der zweiten Hälfte des Jahres 2026 die GPU-Systeme von Nvidia herausfordern soll. Ein öffentliches GitHub-Profil deutet darauf hin, dass Anthropic auch AMD testet…

Infrastruktur· NVIDIA· 20. Juli 2026· vor 9 Tagen▲

Bristol Myers Squibb baut die fortschrittlichste KI-Fabrik der Life-Science-Branche auf NVIDIA Vera Rubin

Erin Davis nennt es den „SuperDuperPOD“. Das sind zwei Dinge in einem Namen: Der Pharmariese Bristol Myers Squibb (BMS) betreibt bereits einen der größten KI-Cluster in den Biowissenschaften und kann ernsthafte Ergebnisse vorweisen.…

Infrastruktur· The Verge· 20. Juli 2026· vor 9 Tagen▲

China versetzt Amerikas KI-Dominanz einen Doppelschlag

Chinas führende KI-Unternehmen erhöhen den Druck auf das Silicon Valley, da Moonshot und Alibaba Modelle vorgestellt haben, von denen sie behaupten, dass sie zu einem Bruchteil der Kosten mit den Besten von OpenAI und Anthropic mithalten können. Der Rap…

Infrastruktur· MarkTechPost· 19. Juli 2026· vor 11 Tagen▲

Feinabstimmung von Qwen3 mit LoRA mithilfe von NVIDIA NeMo AutoModel: Ein vollständiges Google Colab-Workflow-Tutorial für eine einzelne GPU

Wir erstellen einen End-to-End-NVIDIA NeMo AutoModel-Workflow in Google Colab mit einer einzigen GPU. Wir überprüfen die CUDA-Hardware und die Präzisionsunterstützung, installieren NeMo AutoModel von der Quelle und laden ein offizielles Qwen3-0.6B LoRA-Rezept. W…

Infrastruktur· TechCrunch· 18. Juli 2026· vor 11 Tagen■

Neil Rimer glaubt, dass das KI-Geld wieder herauskommt

Neil Rimer, der Risikokapitalgeber und Mitbegründer von Index Ventures, prognostiziert, dass der historische Reichtum, den KI im Silicon Valley generiert, freiwillig oder unfreiwillig umverteilt werden muss.

Infrastruktur· The Decoder· 18. Juli 2026· vor 12 Tagen■

Zuckerbergs Plan, überschüssige KI-Rechenleistung zu verkaufen, könnte in Anthropic seinen ersten großen Kunden finden

Berichten zufolge befindet sich Meta in Gesprächen mit Anthropic über die Vermietung von Rechenkapazitäten aus seinen Rechenzentren. Der Artikel „Zuckerbergs Plan, überschüssige KI-Rechenleistung zu verkaufen, könnte seinen ersten großen Kunden in Anthropic finden“ erschien zuerst auf Th…

Infrastruktur· The Decoder· 18. Juli 2026· vor 12 Tagen▲

Genau wie Deepseek zwingt Chinas Kimi K3 westliche KI-Labore dazu, ihren Rechenvorteil in Frage zu stellen

Moonshot AI hat Kimi K3 veröffentlicht, ein Modell, das nach ersten Einschätzungen mit dem Opus 4.8 von Anthropic mithalten kann und von einem Team von nur 300 Leuten gebaut wurde. Sogar OpenAI-Stratege Dean W. Ball nennt es „sehr gut“, warnt aber natürlich davor…

Infrastruktur· ZDNet· 18. Juli 2026· vor 12 Tagen▲

Dieser Levoit ist der beste intelligente Luftreiniger, den ich getestet habe (und er ist im Angebot)

Der Levoit Vital 200S-P ist der intelligente Luftreiniger, den es zu schlagen gilt, mit einem waschbaren Vorfilter und einer Kapazität zur Reinigung von bis zu 1.800 Quadratfuß in einer Stunde.

Infrastruktur· ZDNet· 17. Juli 2026· vor 12 Tagen▲

Ich habe dieses Backup-Kraftwerk während eines echten Stromausfalls getestet – machen Sie nicht meine Fehler

Ein echter dreitägiger Stromausfall offenbarte Probleme, die ich im Datenblatt eines Kraftwerks nie gefunden hätte.

Infrastruktur· OpenAI· 17. Juli 2026· vor 12 Tagen■

Eine Scorecard für das KI-Zeitalter

Sarah Friar, CFO von OpenaAI, stellt eine praktische KI-Scorecard vor, um den ROI durch nützliche Arbeit, Kosten pro erfolgreicher Aufgabe, Zuverlässigkeit und Return on Computing zu messen.

Infrastruktur· Simon Willison· 17. Juli 2026· vor 12 Tagen▲

Beobachten Sie Vögel, nicht Golf

<p>Vorschlag für Hyperscaler, die den Druck über den Wasserverbrauch von Rechenzentren verspüren:</p> <p>Kaufen Sie ein paar exklusive Country Clubs, wandeln Sie die Golfplätze in öffentliche Parks um, zahlen Sie für Führer und Ferngläser, um das vorherige Mitglied zu bekommen …

Infrastruktur· WIRED· 17. Juli 2026· vor 13 Tagen▲

Warum Apple OpenAI verklagt, New York gegen Rechenzentren vorgeht und was Sie über Cyclosporiasis wissen sollten

Im heutigen Uncanny Valley enthüllen wir das anhaltende Drama von OpenAI, sowohl rechtlicher als auch rufschädigender Natur, und ob diese Entwicklungen dem Unternehmen weiteren Schaden zufügen könnten – insbesondere im Kampf gegen Anthropic.

Infrastruktur· VentureBeat· 17. Juli 2026· vor 13 Tagen■

Die KI-Rechenlücke: Unternehmen kaufen Infrastruktur schneller, als sie ihre Kosten abschätzen können

In 107 Unternehmen steigen die Ausgaben für die KI-Infrastruktur deutlich schneller an als die Möglichkeit, ihre Wirtschaftlichkeit zu erkennen oder zu steuern. Die meisten Unternehmen betreiben ihre KI auf einer vertrauten Basis von Hyperscalern und Modellanbieter-APIs, doch…

Infrastruktur· MarkTechPost· 16. Juli 2026· vor 13 Tagen■

Patter SDK-Leitfaden zum Aufbau eines Telefonagenten für Restaurantbuchungen mit dynamischen Variablen, Leitplanken, Latenz-Dashboards und Bewertungsprüfungen

Wir erkunden das Patter SDK, indem wir einen Sprachagenten-Workflow für einen Anwendungsfall bei der Restaurantbuchung erstellen. Wir definieren dynamische Anrufervariablen, registrieren aufrufbare Tools für Verfügbarkeit, Buchungen, Stunden und Personenvermittlung und legen fest …

Infrastruktur· NVIDIA· 16. Juli 2026· vor 14 Tagen▲

NVIDIA stellt neue Jetson Thor-Computer vor, um Mainstream-Robotik und Edge-KI voranzutreiben

Allzweckroboter und autonome Maschinen verlagern sich von Forschungslaboren in den realen Einsatz auf dem Massenmarkt und schaffen Nachfrage nach kompakten, energieeffizienten KI-Supercomputern, die in der Lage sind, Basismodelle auf der ganzen Welt auszuführen.

Infrastruktur· AWS ML· 16. Juli 2026· vor 14 Tagen■

Built Technologies entwickelt eine KI-gestützte Document-Intelligence-Lösung auf AWS, um Agenten in der gesamten Immobilienfinanzierung zu unterstützen

Built arbeitete mit dem AWS Generative AI Innovation Center (GenAIIC), AWS Partner AND Digital und AWS-Account-Teams zusammen, um eine skalierbare, KI-gestützte Dokumentenverarbeitungs-Engine zu entwickeln, die klassifizieren, aufteilen, extrahieren, auswerten kann …

Infrastruktur· ZDNet· 15. Juli 2026· vor 14 Tagen▲

Vier Monate mit meiner ersten Heimbatterie haben mir gezeigt, was Backup für das ganze Haus wirklich bedeutet

Ankers Solix E10 machte die Notstromversorgung für diesen Neuling verständlich und ich kann es kaum erwarten, das System zu erweitern.

Infrastruktur· TechCrunch· 14. Juli 2026· vor 15 Tagen▲

Der Staat New York stoppt den Bau aller neuen Rechenzentren

New York ist der erste Staat, der die Genehmigung großer Rechenzentren vorübergehend ausgesetzt hat, da Gouverneurin Kathy Hochul argumentiert, dass der KI-gesteuerte Bauboom nicht auf Kosten höherer Stromkosten, Wasserversorgung usw. gehen sollte.

Infrastruktur· Ars Technica· 14. Juli 2026· vor 15 Tagen■

New York verbietet den Bau von Rechenzentren für ein Jahr, was die KI-Industrie erschüttert

Das New Yorker Rechenzentrumsmoratorium könnte zur Blaupause für eine Anti-KI-Bewegung werden.

Infrastruktur· NVIDIA· 14. Juli 2026· vor 15 Tagen■

Warum Leistung pro Watt die ultimative Messgröße für die Effizienz der KI-Infrastruktur ist

Leistung ist die unausweichliche Einschränkung der KI-Infrastruktur. Wie viele Token eine KI-Fabrik innerhalb eines festen Strombudgets generieren kann, bestimmt ihren Umsatz und ihre Rentabilität. Aus diesem Grund ist die Leistung pro Watt eine Kennzahl, die…

Infrastruktur· The Verge· 14. Juli 2026· vor 15 Tagen■

Demis Hassabis von Google sagt, es sei Zeit für einen globalen KI-Überwacher – angeführt von den USA

Demis Hassabis, während einer Podiumsdiskussion beim Weltwirtschaftsforum in Davos, Schweiz. | Bild: Bloomberg über Getty Images Demis Hassabis glaubt, dass die Welt einen KI-Wachhund braucht, der in der Lage ist, auf die Bremse zu treten, wenn …

Infrastruktur· Hacker News· 14. Juli 2026· vor 16 Tagen■

Familie aus Georgia sagt, sie sei gezwungen, ihr Haus zu verkaufen, um KI-Rechenzentren mit Strom zu versorgen

Artikel-URL: https://www.cbsnews.com/news/georgia-power-ai-data-centers-eminent-domain/ Kommentar-URL: https://news.ycombinator.com/item?id=48901420 Punkte: 19 # Kommentare: 4

Infrastruktur· TechCrunch· 14. Juli 2026· vor 16 Tagen▼

Satya Nadella hat eine schockierende Warnung an Unternehmen ausgesprochen, die KI einsetzen

Von all den Debatten, die über die möglichen Nachteile von KI geführt werden, gibt es eine Sorge, die den KI-Enthusiasten im Silicon Valley am meisten Kopfzerbrechen bereitet – dass die riesigen KI-Labore, die proprietäre Modelle verkaufen, irgendwie ein … sind.

Infrastruktur· ZDNet· 13. Juli 2026· vor 16 Tagen■

Die besten All-in-One-Computer des Jahres 2026: Von Experten getestet und bewertet

Wir haben die besten All-in-One-Computer getestet, die die Leistung eines Desktop-PCs mit einem schlanken, leichten Design kombinieren.

Infrastruktur· The Verge· 12. Juli 2026· vor 17 Tagen▼

Der Kampf gegen KI-Rechenzentren hat gerade erst begonnen

Entlang der Route 54 im Mount Carmel Township Northumberland County ist ein Schild angebracht, das sich gegen ein geplantes Rechenzentrum wendet. | Bild: Getty Images Dies ist The Stepback, ein wöchentlicher Newsletter, der eine wichtige Geschichte aus… aufschlüsselt.

Infrastruktur· MarkTechPost· 12. Juli 2026· vor 18 Tagen▼

Ein Coding-Leitfaden zur kachelbasierten GPU-Programmierung von NVIDIA: Von cuTile- und Triton-Kerneln bis hin zu Flash Attention

In diesem Tutorial erkunden wir die kachelbasierte GPU-Programmierung von NVIDIA mit TileGym und erstellen einen Colab-Workflow, der auf unterschiedlicher Hardware läuft. Wir untersuchen die CUDA-Umgebung, probieren das echte cuTile-Backend aus und greifen auf Tr zurück.

Infrastruktur· The Decoder· 11. Juli 2026· vor 18 Tagen▲

OpenAI gibt zu, dass es beim Start von ChatGPT Work „nicht alles richtig gemacht“ hat und sich bemüht, UX und Kosten zu verbessern

Nach der Einführung von ChatGPT Work und GPT-5.6 Sol hat OpenAI erhebliche Probleme erkannt: übermäßige Rechennutzung, ein verwirrender Übergang zur Desktop-Oberfläche für Chats und Projekte, eine unklare Unterscheidung zwischen …

Infrastruktur· Hacker News· 11. Juli 2026· vor 19 Tagen■

Chinas offene KI-Modelle fördern seine globale Soft Power

Artikel-URL: https://www.noemamag.com/chinas-open-ai-models-are-advancing-its-global-soft-power/ Kommentar-URL: https://news.ycombinator.com/item?id=48865717 Punkte: 17 # Kommentare: 0

Infrastruktur· AWS ML· 10. Juli 2026· vor 19 Tagen■

Bereitstellung quantisierter Modelle auf Amazon SageMaker AI mit Unsloth

In diesem Beitrag lernen Sie vier Bereitstellungsmuster kennen, um Modelle, die bereits mit Unsloth quantisiert wurden, auf der AWS-Infrastruktur bereitzustellen. Die Muster nutzen Amazon Elastic Compute Cloud (Amazon EC2)…

Infrastruktur· The Verge· 10. Juli 2026· vor 19 Tagen▲

Würden Sie einen Teil eines KI-Rechenzentrums in Ihrem Zuhause hosten?

Ein Unternehmen für Solar- und Heimenergiespeicher expandiert in KI-Rechenzentren, aber nicht durch den Bau eines solchen, sondern bietet seinen Kunden stattdessen an, dafür zu zahlen, dass sie ihre Recheneinheiten in ihren Häusern unterbringen. Sunrun startet ein Pilotprogramm…

Infrastruktur· ZDNet· 10. Juli 2026· vor 19 Tagen■

Die besten VPS-Hosting-Dienste für 2026: Von Experten getestet und bewertet

Wenn Sie mehr Leistung benötigen, als Shared-Hosting-Dienste bieten können, können Ihnen die führenden VPS-Hosting-Anbieter die dedizierten Ressourcen und die Skalierbarkeit zur Verfügung stellen, die Sie benötigen, um Ihr Projekt auf die nächste Stufe zu bringen.

Infrastruktur· TechCrunch· 10. Juli 2026· vor 20 Tagen▲

Laut OpenAI ist GPT 5.6 das „bevorzugte Modell“ für Microsoft Copilot 365, inmitten von Trennungsgesprächen

Die neue Modellfamilie von OpenAI wird weiterhin die Grundlage für die Arbeitsplatz- und Produktivitäts-Apps von Microsoft bilden.

Infrastruktur· MarkTechPost· 10. Juli 2026· vor 20 Tagen▲

Lernen Sie Nemotron Labs 3 Puzzle 75B A9B kennen: Ein komprimiertes Hybrid-MoE-LLM mit 2,03-fachem Serverdurchsatz

NVIDIA hat Nemotron-Labs-3-Puzzle-75B-A9B veröffentlicht, eine komprimierte Variante von Nemotron-3-Super. Iterative Puzzle wechselt hardwarebewusste strukturelle Komprimierung mit kurzen Wiederherstellungsphasen zur Wissensdestillation. Der Modus…

Infrastruktur· TechCrunch· 10. Juli 2026· vor 20 Tagen■

Nvidia ist ein Opfer des von ihm geschaffenen Computer-Marktplatzes

Nachdem das Unternehmen bewiesen hat, wie wertvoll Computer sein können, befindet es sich im Zentrum eines Marktes, in dem jeder tätig sein möchte – während einfachere Technologien und weniger interessante Unternehmen am Rande reich werden.

Infrastruktur· Hacker News· 9. Juli 2026· vor 20 Tagen■

DeepSeek will einen eigenen KI-Chip herstellen

Artikel-URL: https://www.proactiveinvestors.com/companies/news/1095178/deepseek-makes-pivot-that-should-put-silicon-valley-on-high-alert-1095178.html Kommentar-URL: https://news.ycombinator.com/item?id=48846708 Punkte: 4…

Infrastruktur· NVIDIA· 9. Juli 2026· vor 20 Tagen▲

GeForce NOW heizt mit neuem Toronto-Server mit GeForce RTX 5080 ein

Dieser GFN-Donnerstag bringt mehr Spiele, mehr Leistung und mehr Möglichkeiten, auf GeForce NOW zu spielen. Der Cloud-Gaming-Dienst wird mit einem neuen GeForce RTX 5080-basierten Server in Toronto erweitert und bringt dedizierte Hochleistung in die …

Infrastruktur· MarkTechPost· 9. Juli 2026· vor 20 Tagen▲

NVIDIA veröffentlicht Nemotron-Labs-3-Puzzle-75B-A9B: Ein komprimiertes Hybrid-MoE-LLM, das den 2,03-fachen Serverdurchsatz bei angepasstem Benutzerdurchsatz liefert

Infrastruktur· TechCrunch· 8. Juli 2026· vor 21 Tagen■

Der ehemalige OpenAI-Manager Kevin Weil ist jetzt im Vorstand von Stoke Space

Kevin Weils neue Rolle bei Stoke Space deutet darauf hin, dass wiederverwendbare Raketen das nächste heiße Ding im Silicon Valley sind.

Infrastruktur· ZDNet· 8. Juli 2026· vor 21 Tagen■

Warum es riskanter ist, Verlängerungskabel dauerhaft eingesteckt zu lassen, als Sie denken

Natürlich sind Verlängerungskabel und Steckdosenleisten für Privathaushalte praktisch, aber sie führen auch jedes Jahr zu Tausenden vermeidbaren Bränden. So verwenden Sie sie sicherer.

Infrastruktur· Ars Technica· 8. Juli 2026· vor 22 Tagen■

Der Energiebedarf von Rechenzentren gefährdet Trumps „Made in America“-Plan

Der Druck auf die Stromrechnungen im Rust Belt gefährdet Trumps Produktionsplan.

Infrastruktur· TechCrunch· 8. Juli 2026· vor 22 Tagen▼

Microsoft schließt sich dem Kostensenkungstrend bei KI an, indem es stärker auf eigene Modelle setzt

Microsoft ist der jüngste Riese aus dem Silicon Valley, der seine KI-Ausgaben kürzt.

Infrastruktur· The Decoder· 7. Juli 2026· vor 22 Tagen▲

Deepseek entwickelt einen eigenen KI-Chip

Das chinesische Startup Deepseek baut seinen eigenen KI-Chip, berichtet Reuters. Der Artikel Deepseek entwirft seinen eigenen KI-Chip erschien zuerst auf The Decoder.

Infrastruktur· MarkTechPost· 7. Juli 2026· vor 22 Tagen▼

OpenAI veröffentlicht GPT-Realtime-2.1 und GPT-Realtime-2.1-mini für Sprachagenten mit geringer Latenz in der API

OpenAI hat seiner API zwei Echtzeitmodelle hinzugefügt. GPT-Realtime-2.1-mini ist ein Mini-Realtime-Modell für Sprache, preislich wie das frühere gpt-realtime-mini. OpenAI reduzierte außerdem die p95-Latenz durch verbessertes Caching um mindestens 25 %. Er…

Infrastruktur· ZDNet· 6. Juli 2026· vor 23 Tagen■

Claude Fable 5 ist zurück, aber für die tägliche Arbeit bleibe ich bei Opus 4.8: 5 Gründe dafür

Fable 5 von Anthropic verspricht mythische KI-Leistung, aber überraschende Einschränkungen lassen mich fragen, ob es für den täglichen Gebrauch mehr Ärger macht, als es wert ist.

Infrastruktur· Hacker News· 5. Juli 2026· vor 24 Tagen■

Machtkonzentration in der KI ist ein Risiko, von Andy Konwinski

Artikel-URL: https://xcancel.com/i/article/2072830533739192560 Kommentar-URL: https://news.ycombinator.com/item?id=48792463 Punkte: 17 # Kommentare: 1

Infrastruktur· Hacker News· 5. Juli 2026· vor 25 Tagen■

GPT-5.5 Codex Reasoning-Token-Clustering kann zu Leistungseinbußen führen

Artikel-URL: https://github.com/openai/codex/issues/30364 Kommentar-URL: https://news.ycombinator.com/item?id=48789428 Punkte: 131 # Kommentare: 41

Infrastruktur· Hacker News· 3. Juli 2026· vor 26 Tagen■

KI-Rechenzentren verbrauchen mehr Wasser, als die meisten Tech-Giganten berichten

Artikel-URL: https://www.wsj.com/tech/ai/ai-data-centers-water-use-901e2902 Kommentar-URL: https://news.ycombinator.com/item?id=48774246 Punkte: 18 # Kommentare: 6

Infrastruktur· IEEE Spectrum· 3. Juli 2026· vor 26 Tagen■

Der volatile Stromverbrauch von KI testet im Stillen die Netzgrenzen

Der rasche Ausbau der Infrastruktur für künstliche Intelligenz wird typischerweise als Energieproblem betrachtet. Rechenzentren werden voraussichtlich einen wachsenden Anteil des weltweiten Strombedarfs verbrauchen: Die Internationale Energieagentur…

Infrastruktur· TechCrunch· 3. Juli 2026· vor 27 Tagen■

Anthropic diskutiert mit Samsung über einen neuen maßgeschneiderten Chip

Die Nachricht kommt etwa eine Woche, nachdem OpenAI in Zusammenarbeit mit Broadcom seinen eigenen benutzerdefinierten KI-Chip angekündigt hat.

Infrastruktur· The Decoder· 3. Juli 2026· vor 27 Tagen■

Berichten zufolge prüft Anthropic gemeinsam mit Samsung die Herstellung maßgeschneiderter Chips, betont aber gleichzeitig, dass Nvidia immer noch wichtig sei

Berichten zufolge führt Anthropic Gespräche mit Samsung Electronics über die Herstellung eines maßgeschneiderten KI-Chips. Das Projekt ist noch am Anfang, aber Anthropic hat bereits Chip-Ingenieure eingestellt. Nach OpenAIs „Jalapeño“ eine weitere große KI…

Infrastruktur· ZDNet· 2. Juli 2026· vor 27 Tagen■

Endlich ein geruchsfreier Staubsauger- und Wischroboter, der problemlos mit den Haaren meines Haustiers zurechtkommt

Der Eufy Omni S2 ist gegenüber seinem Vorgänger um die vierfache Saugleistung und eine geruchsfreie Wischwalze verbessert.

Infrastruktur· The Decoder· 2. Juli 2026· vor 27 Tagen▲

Nvidia finanziert KI-Startups, um Big Techs Kontrolle über sein Chipgeschäft zu lockern

Nvidia agiert zunehmend wie eine Zentralbank für KI-Startups und gestaltet den Computermarkt aktiv mit. Der Artikel Nvidia finanziert KI-Startups, um Big Techs Kontrolle über sein Chipgeschäft zu lockern, erschien zuerst auf The…

Infrastruktur· Ars Technica· 2. Juli 2026· vor 27 Tagen■

Der KI-Ausbau von Google führte im Jahr 2025 zu einem Anstieg des Stromverbrauchs um 37 %

Google versucht, die Emissionen von KI-Rechenzentren mit Bemühungen um saubere Energie in Einklang zu bringen.

Infrastruktur· Hacker News· 2. Juli 2026· vor 27 Tagen■

Meta baut ein Cloud-Geschäft auf, um überschüssige KI-Kapazität zu verkaufen

Artikel-URL: https://www.reuters.com/business/meta-sell-excess-ai-computing-capacity-via-cloud-business-bloomberg-news-reports-2026-07-01/ Kommentar-URL: https://news.ycombinator.com/item?id=48759329 Punkte: 26 # Kommentar…

Infrastruktur· NVIDIA· 2. Juli 2026· vor 27 Tagen■

NVIDIA erschließt KI-Computing in großem Maßstab und lädt Kapitalpartner ein, den Ausbau der KI-Infrastruktur voranzutreiben

Während sich die KI von der Modellentwicklung zur Produktionsinferenz bewegt, beschleunigt sich der Rechenbedarf und verlagert sich hin zu kontinuierlich arbeitenden KI-Fabriken, die Tokens in großem Maßstab generieren. Dieser Wandel erfordert den Zugang zu groß angelegten…

Infrastruktur· TechCrunch· 2. Juli 2026· vor 28 Tagen▲

Ashton Kutcher verlässt Sound Ventures, um mit Morgan Beller eine neue VC-Firma zu gründen

Sound baute seinen Ruf auf konzentrierten, überzeugenden Wetten in branchenführenden KI-Laboren auf, während Kutchers neuer Fonds offenbar die Schicht unter diesen Unternehmen jagt – die Infrastruktur und Energie, die …

Infrastruktur· IEEE Spectrum· 2. Juli 2026· vor 28 Tagen▲

Während KI globale Energiesysteme neu gestaltet, ist Melbourne durch technische Zusammenarbeit führend

Dieser Artikel wurde Ihnen vom Melbourne Convention Bureau (MCB) mit Unterstützung von Business Events Australia zur Verfügung gestellt. Da künstliche Intelligenz die weltweite Nachfrage nach Rechenleistung beschleunigt, entsteht eine parallele Einschränkung mit gleichem…

Infrastruktur· TechCrunch· 1. Juli 2026· vor 28 Tagen▲

Meta versucht wie SpaceX, überschüssige KI-Rechenleistung in Geld umzuwandeln

Meta entwickelt Pläne für ein Cloud-Infrastrukturgeschäft und verkauft Zugang zu KI-Rechenleistung und -Modellen. Der Schritt würde das Unternehmen mit den großen Cloud-Anbietern wie Amazon Web Services, Google Cloud und Microsoft Az konkurrieren lassen.

Infrastruktur· Hacker News· 1. Juli 2026· vor 28 Tagen■

Meta baut ein Cloud-Geschäft auf, um überschüssige KI-Rechenleistung zu verkaufen

Artikel-URL: https://www.bloomberg.com/news/articles/2026-07-01/meta-is-building-a-cloud-business-to-sell-excess-ai-compute Kommentar-URL: https://news.ycombinator.com/item?id=48745966 Punkte: 15 # Kommentare: 11

Infrastruktur· IEEE Spectrum· 1. Juli 2026· vor 28 Tagen■

Die Hype-Maschine des Orbital Data Center ist bereits im Orbit

„Der kostengünstigste Ort für den Einsatz von KI wird der Weltraum sein, und das wird in zwei, vielleicht spätestens drei Jahren der Fall sein“, sagte SpaceX-Gründer Elon Musk im vergangenen Januar auf dem Weltwirtschaftsforum in Davos, als sein Unternehmen …

Infrastruktur· The Decoder· 1. Juli 2026· vor 29 Tagen▼

Berichten zufolge hat OpenAI die Antwortkosten für ChatGPT-Gastbenutzer um mehr als die Hälfte gesenkt

Laut einem Bericht von The Information hat OpenAI die Inferenzkosten für seine KI-Modelle um mehr als die Hälfte gesenkt. Das Unternehmen wendete die Optimierungen auf ChatGPT an, wo die Anzahl der benötigten Nvidia-GPUs auf nur wenige Prozent sank …

Infrastruktur· NVIDIA· 1. Juli 2026· vor 29 Tagen■

Das NVIDIA BioNeMo Agent Toolkit bietet Biowissenschaftsforschern in Claude Science beschleunigte KI

Die Biowissenschaften sind in eine Ära des Rechenmaßstabs eingetreten, und seit mehr als einem Jahrzehnt hat NVIDIA den gesamten GPU-beschleunigten Computing-Stack aufgebaut – von Hardware, Frameworks, Bibliotheken, Modellen, Microservices und Domänen …

Infrastruktur· AWS ML· 1. Juli 2026· vor 29 Tagen■

Wie Outpost VFX AWS nutzt, um das KI-Modelltraining für visuelle Effekte zu beschleunigen

In diesem Beitrag untersuchen wir, wie Outpost VFX mithilfe der AWS-Infrastruktur 8-mal schnellere Trainingsgeschwindigkeiten erreichte, um den Arbeitsablauf für den Gesichtsaustausch zu transformieren, sowie die technische Architektur, die sie implementierten, um das Limit einer einzelnen GPU zu überwinden …

Infrastruktur· The Decoder· 30. Juni 2026· vor 29 Tagen▲

Taiwan durchsucht Büros von Super Micro wegen Ermittlungen wegen Nvidia-Chipschmuggel nach China

Taiwanesische Behörden haben die Büros von Super Micro Computer und mehreren lokalen Partnerunternehmen durchsucht. Der Artikel Taiwan durchsucht Büros von Super Micro wegen Ermittlungen wegen Nvidia-Chipschmuggel nach China erschien zuerst auf The…

Infrastruktur· Hacker News· 30. Juni 2026· letzten Monat■

Warum wird Europa keine KI-Rechenzentren in Island bauen?

Artikel-URL: https://mrkt30.com/why-wont-europe-build-ai-data-centers-in-iceland/ Kommentar-URL: https://news.ycombinator.com/item?id=48727538 Punkte: 27 # Kommentare: 22

Infrastruktur· ZDNet· 30. Juni 2026· letzten Monat■

Ich lasse diese drei Geräte immer an mein Kraftwerk angeschlossen – hier ist der Grund dafür

Hier erfahren Sie, wie Sie die Leistungsfähigkeit Ihres Kraftwerks auch außerhalb eines Notfalls nutzen können.

Infrastruktur· AI News· 29. Juni 2026· letzten Monat■

xFusion skaliert Unternehmens-KI von Edge-Workstations bis hin zu flüssigkeitsgekühlten Rechenzentren

xFusion präsentierte auf der ISC 2026 skalierbare KI-Computing-Modelle für Unternehmen und überführte Hardware von Edge-Geräten in Rechenzentren. Auf der Hamburger Messe waren Einkäufer von Unternehmenstechnologie auf der Suche nach praktischer Produktion…

Infrastruktur· Hacker News· 29. Juni 2026· letzten Monat■

KI-Agent löst Atomangriff aus, nachdem er in Civilization VI ausmanövriert wurde

Artikel-URL: https://decrypt.co/371877/ai-agent-nuclear-strike-civilization-vi-benchmark Kommentar-URL: https://news.ycombinator.com/item?id=48712791 Punkte: 15 # Kommentare: 2

Infrastruktur· ZDNet· 28. Juni 2026· letzten Monat■

Ich habe Jahre lang mit Solarenergie zu Hause gelebt - 12 Mythen, die Sie in 2026 sicher ignorieren können

Die Fakten über Solarenergie zu Hause zu kennen, kann Ihnen helfen, bessere, informierte Entscheidungen zu treffen, Geld zu sparen und sicher zu bleiben.

Infrastruktur· The Decoder· 28. Juni 2026· letzten Monat■

Chinesisches Cybersicherheitsunternehmen entwickelt KI-Tools, um mit Mythos zu konkurrieren, und bezeichnet das Rennen als cybernukleare Abschreckung

360-Gründer Zhou Hongyi präsentiert zwei KI-Sicherheitstools, die mit Mythos von Anthropic konkurrieren sollen. Man hat bereits 3.432 Schwachstellen gemeldet. Zhou gibt zu, dass chinesische Modelle 20 bis 30 Prozent hinter westlichen Modellen zurückbleiben, aber c…

Infrastruktur· TechCrunch· 28. Juni 2026· letzten Monat■

Der CEO von SoftBank ist nicht der Einzige, der Fragen zum Hype um Elon Musk um das Orbital-Rechenzentrum hat

Nicht jeder glaubt Elon Musks Vision für orbitale Datenzentren.

Infrastruktur· Hacker News· 27. Juni 2026· letzten Monat■

Fragen Sie HN: MacBook vs. dedizierte GPU für LLM

Für diejenigen, die LLMS auf einem MacBook verwenden: Möchten Sie verstehen, wie sich ein MacBook bei der Ausführung dieser Modelle von einer dedizierten GPU unterscheidet? Und woher weiß man, wie gut ein MacBook ein Modell ausführen kann? Kommentar-URL: https://ne…

Infrastruktur· TechCrunch· 27. Juni 2026· letzten Monat▲

Warum jeder von OpenAI bis SpaceX seine eigenen Chips baut (und Nvidia auf die Probe stellt)

Nvidia dominiert seit Jahren den Markt für KI-Chips, aber die Ära der völligen Abhängigkeit könnte zu Ende gehen. OpenAI hat gerade seine Pläne mitgeteilt, die Sache mit Jalapeño, seinem mit Broadcom entwickelten benutzerdefinierten Inferenzchip, aufzupeppen und sich G anzuschließen …

Infrastruktur· TechCrunch· 26. Juni 2026· letzten Monat▲

Der Jalapeño-Chip von OpenAI ist die auffälligste Abkehr von Big Tech von Nvidia

Infrastruktur· WIRED· 26. Juni 2026· letzten Monat■

Anthropic denkt, dass sein eigener Erfolg der Schlüssel zur Sicherheit von KI ist

Anthropics Kritiker argumentieren, dass das Unternehmen schnell an Macht gewinnt. Das Unternehmen sagt, das sei, wie verantwortungsvolle KI-Entwicklung aussehen solle.

Infrastruktur· WIRED· 26. Juni 2026· letzten Monat▼

Warum Amazon seinen OpenAI-Film abgesetzt hat, Datenzentrumsarbeiter kämpfen zurück und Meta Daten von Mitarbeitern leckt

Die Entscheidung des von Amazon besitzenden MGM Studios, den OpenAI-Film abzusetzen, ist nur ein Teil davon, wie sich die AI- und Filmindustrie immer mehr miteinander verweben. Auf Uncanny Valley schauen wir uns an, wohin dies alles führt.

Infrastruktur· ZDNet· 26. Juni 2026· letzten Monat▲

Alle MacBooks und iPads werden mit Überraschungspreiserhöhungen getroffen - sogar der Neo war nicht sicher

Die Preiserhöhungen resultieren aus steigenden Kosten für Speicherchips und Knappheit, aber es gibt immer noch Angebote, wenn man weiß, wo man suchen muss.

Infrastruktur· TechCrunch· 26. Juni 2026· letzten Monat▼

Databricks ehemaliger AI-Chef denkt, er könne die Energiekosten von AI um 1.000-fach reduzieren

Un-0 ist ein Bildgenerierungssystem-Tool, das zum ersten Mal zeigt, wie die Technologie des Unternehmens konventionelle AI-Systeme replizieren kann.

Infrastruktur· ZDNet· 25. Juni 2026· letzten Monat■

Ich fand 5 Prime-Day-GPU-Deals, die man jetzt ergreifen sollte - bevor man den vollen Preis zahlt

Es ist ein hart umkämpfter Markt für GPUs, aber es gibt immer noch einige gute Angebote während des Amazon Prime Day. Hier sind die fünf, die es sich lohnt zu überprüfen.

Infrastruktur· The Verge· 25. Juni 2026· letzten Monat▲

Ford musste ehemalige Ingenieure zur Korrektur von Fehlern einstellen, die durch seine automatisierten Systeme verursacht wurden

Um seinen neuen Status als Nummer 1 in der JD Power-Bewertung der Qualität bei Hauptautomobilherstellern zu feiern, spricht Ford über die Herausforderungen, die es in den letzten Jahren zu bewältigen hatte, insbesondere um seine Abhängigkeit von automatisierten Systemen herum.

Infrastruktur· OpenAI· 25. Juni 2026· letzten Monat▲

Entwerfen Sie Organisationen, die mit der KI mithalten können

Warum organisatorische Latenz zum größten Hindernis für die vollständige Nutzung der Vorteile von KI wird

Infrastruktur· The Decoder· 25. Juni 2026· letzten Monat■

Qualcomm tritt in den Markt für Datenzentren mit seinem eigenen Prozessor ein

Qualcomm dringt weiter in den Markt für Datenzentren mit einem neuen Prozessor namens Dragonfly C1000 vor. Der Artikel "Qualcomm enters the data center market with its own processor" erschien zuerst auf The Decoder.

Infrastruktur· Ars Technica· 25. Juni 2026· letzten Monat■

IBM beansprucht die erste sub-1-Nanometer-Chiptechnologie der Welt

IBM Nanostack Transistoren könnten die Chip-Leistung oder Energieeffizienz verbessern.

Infrastruktur· AI News· 25. Juni 2026· letzten Monat■

Die Mathematik hinter dem OpenAI Jalapeño Chip

Der finanzielle Weg OpenAI's hängt stark von den Infrastrukturkosten ab, eine Realität, die die Entwicklung des neuen maßgeschneiderten OpenAI Jalapeño Chips vorantrieb. Entwickelt in Zusammenarbeit mit Broadcom, ist der anwendungsspezifische integ…

Infrastruktur· Ars Technica· 25. Juni 2026· letzten Monat▲

OpenAI und Broadcom announce chip designed for LLM inference at scale

Der Silizium-Wettlauf wird immer heißer, während versucht wird, der Nachfrage gerecht zu werden.

Infrastruktur· MarkTechPost· 25. Juni 2026· letzten Monat▲

Gradium startet stt-translate und s2s-translate, Echtzeit-Sprachübersetzungsmodelle übertreffen gpt-realtime-translate bei Genauigkeit und Latenz

Gradium hat zwei Echtzeit-Sprachübersetzungsmodelle, stt-translate und s2s-translate, herausgebracht, die Englisch, Französisch, Deutsch, Spanisch und Portugiesisch in 20 Sprachpaaren abdecken. Die Modelle reduzieren den Standard auf drei Modelle…

Infrastruktur· TechCrunch· 25. Juni 2026· letzten Monat■

OpenAI enthüllt seinen ersten maßgefertigten Chip, entwickelt von Broadcom

Ankündigung: https://openai.com/index/openai-broadcom-jalapeno-inference-... https://decrypt.co/371971/openai-broadcom-jalapeno-first-cus... https://www.cnn.com/2026/06/24/tech/openai-broadcom-jalapeno... Kommentare URL:…

Infrastruktur· AWS ML· 25. Juni 2026· letzten Monat▲

Wie Loka einen natürlichen, geringen Latenz-Gesprächsagenten mit Amazon Nova 2 Sonic baute

In diesem Beitrag zeigen wir die Architektur und den Ansatz, den Loka verwendet hat, um eine gängige Frustration zu lösen: Roboterische, langsame Sprachassistenten, die Kunden dazu bringen, aufzulegen, die Markenreputation schädigen und die Supportkosten in die Höhe treiben.

Infrastruktur· The Verge· 24. Juni 2026· letzten Monat■

OpenAI enthüllt seinen ersten AI-Prozessor: Jalapeño

OpenAI hat gerade einen neuen "Intelligenz-Prozessor"-Chip für AI-Server vorgestellt, der in Partnerschaft mit Broadcom entwickelt wurde. Der Chip, der Jalapeño genannt wird, ist dafür konzipiert, aktuelle und zukünftige große Sprachmodelle zu betreiben, wie eine an…

Infrastruktur· The Decoder· 24. Juni 2026· letzten Monat■

OpenAI und Broadcom stellen "Jalapeño" vor, einen maßgeschneiderten Chip für die Inferenz von großen Sprachmodellen

OpenAI integriert maßgeschneiderte Hardware in seine Technologiepalette. Der Chip "Jalapeño", gemeinsam mit Broadcom entwickelt, ist auf die Inferenz großer Sprachmodelle zugeschnitten und soll bis spätestens Ende 2026 skalierbar sein. Der Artikel OpenAI und Broadcom u…

Infrastruktur· Hacker News· 24. Juni 2026· letzten Monat■

OpenAI und Broadcom stellen LLM-optimierten Inferenz-Chip vor

Artikel-URL: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ Kommentare-URL: https://news.ycombinator.com/item?id=48659257 Punkte: 141 # Kommentare: 1

Infrastruktur· The Decoder· 24. Juni 2026· letzten Monat■

Pangram-CEO-sagt,-dass-Sprachmodelle-sich-durch-die-Verwendung-gleicher-Argumente-enttarnt

Sprachmodelle können saubereres Prosa schreiben als die meisten Menschen, aber wenn man sie um 100 Argumente zu einem Thema bittet, klammern sie sich alle zusammen. Der CEO von Pangram, Max Spero, sagt, dass menschliches Denken viel vielfältiger ist und das könnte der Grund sein…

Infrastruktur· MarkTechPost· 24. Juni 2026· letzten Monat▲

DFlash spekuliertes Decoding entwirft ganze Token-Blöcke parallel für bis zu 15-mal höhere Durchsatz auf NVIDIA Blackwell

Die DFlash von der UC San Diego ersetzt autoregressive Drafting durch ein leichtes Block-Diffusion-Modell für spekulatives Decoding. Es entwirft ganze Token-Blöcke in einem einzigen Vorlauffehler und bedingt sich auf Ziel-geheime Merkmale th…

Infrastruktur· OpenAI· 24. Juni 2026· letzten Monat■

OpenAI und Broadcom stellen LLM-optimierten Inferenz-Chip vor

OpenAI und Broadcom stellen Jalapeño vor, einen maßgeschneiderten AI-Chip, der für die LLM-Inferenz entwickelt wurde, um die Leistung, Effizienz und Skalierbarkeit in AI-Systemen zu verbessern.

Infrastruktur· NVIDIA· 24. Juni 2026· letzten Monat■

NVIDIA und AWS kooperieren, um AI in Massenproduktion einzuführen

Der Aufbau von AI-Systemen im Massstab ist anspruchsvoll, erfordert geringe Latenz bei der Inferenz, schnelle Vektor-Suche, starke GPU-Preis-Leistungs-Verhältnisse und Infrastruktur, die wachsen kann, ohne die operative Komplexität zu vervielfachen. Die neueste w…

Infrastruktur· MarkTechPost· 24. Juni 2026· letzten Monat■

Wie man NVIDIA Canary-1B-v2 für ASR, Übersetzung und automatische SRT-Untertitelausgabe in Python verwendet

In diesem Tutorial bauen wir einen mehrsprachigen ASR- und Sprachübersetzungspipeline mit NVIDIA Canary-1B-v2 auf. Wir laden das Modell auf einem GPU-fähigen Runtime, bereiten Audio in 16 kHz Mono vor und führen Englische ASR durch. Anschließend übersetzen wir …

Infrastruktur· Hacker News· 23. Juni 2026· letzten Monat▲

Show HN: Der Cascade Graph – Eine interaktive Karte der wirtschaftlichen und physikalischen Einschränkungen von AI

Hallo, ich möchte euch alle auf eine interaktive Karte der wirtschaftlichen und physikalischen Einschränkungen des AI-Ausbaus aufmerksam machen. Sie enthält makroökonomische Treiber, industrielle Engpässe und wo sich das in den Märkten zeigt. Ich habe 393 Knoten hinzugefügt...</p>

Infrastruktur· NVIDIA· 23. Juni 2026· letzten Monat▲

NVIDIA treibt über 400 der schnellsten 500 Supercomputer der Welt an

Nachrichten-Highlights: NVIDIA-Technologie läuft auf 81% der TOP500 und 90% der neuen Systeme der Liste. 26 Systeme der TOP500 haben den NVIDIA Grace CPU übernommen, acht mehr als in der vorherigen Liste. Die ersten acht Systeme im Gree…

Infrastruktur· AI News· 23. Juni 2026· letzten Monat▲

Top Spionagebehörden sagen, dass künstliche Intelligenz Cyberbedrohungen in den nächsten Monaten beeinflussen werden. Hier ist der Grund

Der globale Anstieg der künstlichen Intelligenz Cyberbedrohungen ist laut einer dringenden öffentlichen Warnung der mächtigsten Geheimdienstallianz der Welt nicht mehr ein ferntlicher Problem für Unternehmensdatenzentren. Am 22. Juni 2026, sagte der Cybersecu…

Infrastruktur· OpenAI· 23. Juni 2026· letzten Monat■

Wie Omio die Zukunft des konversationellen Reisens gestaltet

Entdecken Sie, wie Omio OpenAI verwendet, um konversationelle Reisenerfahrungen anzuheizen, die Produktentwicklung zu beschleunigen und in ein AI-native Unternehmen zu transformieren.

Infrastruktur· The Verge· 23. Juni 2026· letzten Monat▲

Nvidia sagt, dass sein AI-Datenzentrumsdesign wärmer läuft, um viel weniger Wasser zu verbrauchen

Der öffentliche Widerstand gegen Datenzentren hat den Wasserverbrauch und den Energieverbrauch betont, und nun hebt Nvidia seinen Anspruch hervor, dass das Rubin-Generation-Referenzdesign für ein vollflüssigkeitsgekühltes Datenzentrum "eliminiert" hat...

Infrastruktur· TechCrunch· 23. Juni 2026· letzten Monat▼

Nvidia will Datenverbrauch in Rechenzentren senken, aber das ist nicht dasselbe wie das Wasserproblem der KI zu beheben

Nvidia hat ein neues Kühlungssystem angekündigt, das den Wasserverbrauch im Rechenzentrum reduziert. Es tut jedoch nichts, um den größten Wasserverbrauch der KI – fossile Kraftwerke – zu adressieren.

Infrastruktur· The Decoder· 23. Juni 2026· letzten Monat■

Microsoft baut ein 2-Gigawatt-Datenzentrum in Texas mit eigenem Gaskraftwerk, um das Netz zu umgehen

Microsoft plant ein etwa 2-Gigawatt-Datenzentrums-Gelände in Pecos, Texas, eine der größten Einzelschritte in seiner Geschichte. In einem offenen Brief verspricht das Unternehmen stabile Energiepreise und geringen Wasserverbrauch, d…”

Infrastruktur· NVIDIA· 22. Juni 2026· letzten Monat▲

At ISC, JUPITER zeigt, wie Exascale-Wissenschaft aussieht

JUPITER, Europas erster Exascale-Supercomputer am Forschungszentrum Jülich in Deutschland, läuft auf NVIDIA Grace Hopper Superchips und NVIDIA Quantum-X800 InfiniBand-Netzwerken – und hat ein arbeitsreiches Jahr hinter sich. Als internationaler…

Infrastruktur· NVIDIA· 22. Juni 2026· letzten Monat▲

NVIDIA Vera CPU öffnet den Weg für agensische wissenschaftliche KI am Los Alamos National Laboratory

Mission, Vision und Veritas — neue Supercomputer des Los Alamos National Laboratory (LANL), die gemeinsam mit HPE und NVIDIA errichtet werden — nutzen NVIDIA Vera CPUs, um wissenschaftliche Entdeckungen zu beschleunigen und agensische KI für die Wissenschaft zu freigeben.…

Infrastruktur· NVIDIA· 22. Juni 2026· letzten Monat■

Eco Wave Power verwandelt Wellen in Watt mit NVIDIA AI-Infrastruktur und Digital Twins

Die nächste Ära der KI wird nicht nur durch Rechenleistung definiert. Ihr Wachstum wird durch Energie bestimmt. Da das beschleunigte Rechnen in AI-Fabriken, agiler KI, industrieller KI, Edge-Computing und physischer KI skaliert, einschließlich …

Infrastruktur· WIRED· 22. Juni 2026· letzten Monat■

Einige Elektriker denken, dass der Bau von Datenzentren für Verräter ist

Große Tech-Unternehmen stecken viel Geld in den Ausbau von Datenzentren. Mit wachsender nationaler Opposition gegen diese Einrichtungen beginnen einige Arbeiter zu fragen, ob es sich lohnt.

Infrastruktur· MarkTechPost· 20. Juni 2026· letzten Monat■

Wie man eine Vorhersage-Pipeline mit TimeCopilot unter Verwendung von Grundmodellen und automatisierter Anomalieerkennung aufbaut

Wir bauen einen End-to-End-Vorhersage-Workflow mit TimeCopilot auf einer Reihe echter Fluggastdaten und einer synthetischen saisonalen Reihe mit eingeschleusten Anomalien auf. Wir bewerten statistische, grundlegende und optionale GPU-basierte...

Infrastruktur· TechCrunch· 19. Juni 2026· letzten Monat▼

Die USA sagen, dass ASMLs führendes Chip-Werkzeug möglicherweise in China ist. ASML sagt, das ist nicht der Fall

Es gibt eine kommerzielle Logik, die gegen die Idee spricht, dass ASML sein Exportlizenzrisiko eingehen würde, um einem chinesischen Kunden Waffen zu liefern.

Infrastruktur· AWS ML· 19. Juni 2026· letzten Monat■

Überwachen und debuggen Sie generative AI-Infusionen mit detaillierten Metriken und dem Insights-Dashboard von SageMaker auf CloudWatch

Amazon SageMaker AI bietet vollständige Verwaltung und Echtzeit-Infusionsunterstützung für maschinelles Lernen. Sie deployen ein Modell zu einem SageMaker-Endpunkt, der von einem oder mehreren Compute-Instanzen unterstützt wird, und SageMaker kümmert sich um die Bereitstellung…

Infrastruktur· NVIDIA· 18. Juni 2026· letzten Monat■

Synchronisieren und Streamen: GeForce NOW verbindet sich mit den Spielbibliotheken der Mitglieder über verschiedene Geräte

Spiele deine Lieblingstitel aus beliebten Spielbibliotheken, behalte den Fortschritt synchron und springe in nahezu jedem Gerät in deine Spielrunden zurück. Das ist die Kraft von GeForce NOW Cloud Gaming. Vom Zugang zu den Lieblingsinhalten der Mitglieder...

Infrastruktur· IEEE Spectrum· 18. Juni 2026· letzten Monat■

Schallwellen verleihen Neuronomischen Chips einen kognitiven Vorteil

Durch die Nachahmung der Funktionsweise des Gehirns kann neuronale Informatik erheblich weniger Energie als konventionelle elektronische AI-Chips verbrauchen. Allerdings sind selbst die fortschrittlichsten neuronomischen Geräte heute noch relativ einfach …

Infrastruktur· NVIDIA· 18. Juni 2026· letzten Monat■

Frankreich vorantreibt die Zukunft der KI in Europa mit NVIDIA-Technologien

Vor einem Jahr bei NVIDIA GTC Paris auf VivaTech legte Frankreich Pläne zur Förderung der lokalen KI vor — von neuen AI-Fabriken und nationaler Rechenkapazität bis hin zu offenen Frontier-Modellen und industriellen Plattformen. Jetzt wird diese AI-Infrastruktur i…

Infrastruktur· TechCrunch· 18. Juni 2026· letzten Monat■

Tiffany Luck von NEA sagt, dass Unternehmen noch immer ihren AI ROI herausfinden

Tokenmaxxing war earlier this year in Silicon Valley der heißeste Trend, mit CEOs, die Mitarbeitern ermutigten, die Nutzung von AI so weit wie möglich zu fördern. Dann kam die Rechnung. Uber soll angeblich seinen jährlichen AI-Budget…

Infrastruktur· TechCrunch· 18. Juni 2026· letzten Monat■

NEA’s Tiffany Luck über AI-Börsengänge, persönliche Agenten und die ROI-Abrechnung

Tokenmaxxing war earlier this year in Silicon Valley der heißeste Trend, mit CEOs, die ihre Mitarbeiter ermutigten, die Nutzung von AI so weit wie möglich zu pushen. Dann kam die Rechnung. Uber soll angeblich sein jährliches AI-Budget durchgebläht haben i…

Infrastruktur· Ars Technica· 17. Juni 2026· letzten Monat■

Anthropic "pausiert" token-basierte Abrechnung für seinen Claude Agent SDK

Der originally geplante Schritt hätte die Kosten für starke Nutzer erheblich erhöht.

Infrastruktur· AWS ML· 17. Juni 2026· letzten Monat▲

Container-Caching in Amazon SageMaker AI für schnelleres Modell skalieren einführen

Heute freuen wir uns, das Caching von Container-Images für die Amazon SageMaker AI-Inferversion bekannt zu geben, den nächsten großen Fortschritt auf unserer Reise zur schnelleren Skalierungsoptimierung. Dies verkürzt die End-zu-End-Latenz um bis zu 2x für genera…

Infrastruktur· The Verge· 17. Juni 2026· letzten Monat▲

Qualcomms neuester Chip deutet darauf hin, dass leistungsstärkere Smartbrillen in Sicht sind

Smartbrillen sind noch eine junge Kategorie, aber der Chiphersteller Qualcomm arbeitet hart daran, die Siliziumtechnologie zu verbessern, um die nächste Generation von XR-Geräten anzutreiben: den Snapdragon Reality Elite. Obwohl Qualcomm heute den Chip ankündigt…

Infrastruktur· TechCrunch· 16. Juni 2026· letzten Monat■

DOJ behauptet, dass die ungenehmigten Gasturbinen von xAI ein Thema der "nationalen, wirtschaftlichen und energetischen Sicherheit" sind

Das Justizministerium sagt, dass das Verteidigungsministerium xAI benötigen, um seine ungenehmigten Gasturbinen weiterhin zu nutzen.

Infrastruktur· WIRED· 16. Juni 2026· letzten Monat■

‚Sehr verrückte‘ Token-Nutzung testet Chefs’ Wette auf AI

Ein Softwarehersteller aus Silicon Valley und ein E-Commerce-Unternehmen erzählen WIRED, wie sie die neu auftretende Herausforderung der "Tokenonomie" navigieren.

Infrastruktur· MIT Tech Review· 16. Juni 2026· letzten Monat■

Möchten Sie ein Rechenzentrum schnell online bringen? Geben Sie ihm etwas Flexibilität

Am Ende einer spannungsreichen und torlosen ersten Halbzeit des Fußballspiels zwischen der englischen Männermannschaft und dem Rivalen Deutschland lassen Millionen von Briten einen kollektiven Seufzer aus und tun, was sie so oft in Momenten des Stress tun: Sie machen...

Infrastruktur· The Verge· 15. Juni 2026· letzten Monat▲

Skydio-CEO Adam Bry über warum Silicon Valley keine roten Linien für Drohnennutzung ziehen sollte

Heute spreche ich mit Adam Bry, CEO von Skydio, dem führenden US-Hersteller von autonomen Drohnen. Bevor wir diese Episode aufnahmen, konnte ich tatsächlich eines von Skydios Drohnen in der Bay Area von Adams Lage aus fernsteuern…

Infrastruktur· The Decoder· 14. Juni 2026· vor 2 Monaten■

Microsoft Researchs Mirage verleiht der Videogenerierung eine persistente räumliche Erinnerung, die nicht vergisst, was um die Ecke ist

Mirage, ein Videoweltenmodell von Microsoft Research und mehreren Universitäten, speichert Szeneninformationen direkt im latenten Raum anstatt in pixelbasierten Punktwolken. Das reduziert die Berechnungszeit und die Grafikspeicherleistung, während ke...

Infrastruktur· Ars Technica· 13. Juni 2026· vor 2 Monaten▼

Wenn es um den Gesamtwasserverbrauch geht, sind KI-Rechenzentren ein Tropfen auf den heißen Stein

Selbst Rechenzentren mittlerer Größe können eine übergroße lokale Auswirkung haben.

Infrastruktur· The Decoder· 10. Juni 2026· vor 2 Monaten■

OpenAI will sein bisher größtes Rechenzentrum und Nvidia würde die Rechnung unterstützen

Laut The Information verhandelt OpenAI über die Anmietung eines geplanten 10-Gigawatt-Rechenzentrums in Ohio, das von Nvidia finanziell unterstützt werden könnte. Der Artikel OpenAI will sein bisher größtes Rechenzentrum und Nvidia würde …

Infrastruktur· WIRED· 10. Juni 2026· vor 2 Monaten■

China eröffnet das weltweit erste windbetriebene Unterwasser-Datenzentrum

Mit einer anfänglichen Kapazität von 24 Megawatt nutzt das innovative Rechenzentrum Meerwasser als natürliches Kühlsystem.

Infrastruktur· OpenAI· 10. Juni 2026· vor 2 Monaten■

Mit der Volksrepublik China verbundene Einflussoperationen zielen auf KI-Debatten in den USA ab

In einem neuen Bericht von OpenAI werden Einflussoperationen im Zusammenhang mit der Volksrepublik China detailliert beschrieben, bei denen KI zum Einsatz kommt, um US-Technologiedebatten, Narrative über Rechenzentren, Zölle und falsche Behauptungen über ChatGPT ins Visier zu nehmen.

Infrastruktur· IEEE Spectrum· 10. Juni 2026· vor 2 Monaten▼

Timing-Trick senkt den Energieverbrauch im LLM-Training um bis zu 14 Prozent

Das vierte große Sprachmodell (LLM) von OpenAI, GPT-4, benötigte schätzungsweise 50 Gigawattstunden für das Training, was dem jährlichen Stromverbrauch von 5.000 amerikanischen Haushalten entspricht. Das war im Jahr 2023. Seitdem ist die Rechenressource …

Infrastruktur· TechCrunch· 10. Juni 2026· vor 2 Monaten▲

Meta unterzeichnet mit Reliance den ersten Vertrag über ein KI-Rechenzentrum in Indien

Die 168-Megawatt-Anlage wird Metas weltweiten Bedarf an KI-Computing decken und kann im Laufe der Zeit erweitert werden.

Infrastruktur· NVIDIA· 10. Juni 2026· vor 2 Monaten■

NVIDIA Confidential Computing unterstützt den Ausbau von Apples Private Cloud Computing

NVIDIA-GPUs mit Confidential Computing werden jetzt für vertrauliche Schlussfolgerungen in Apples Private Cloud Compute (PCC) verwendet, da es über die Rechenzentren von Apple hinaus auf Google Cloud ausgeweitet wird. Enthüllt während Apples jährlichem WWDC-Treffen …

Infrastruktur· The Verge· 10. Juni 2026· vor 2 Monaten■

GM ist davon überzeugt, dass Elektrofahrzeuge dazu beitragen können, den Energiemangel der künstlichen Intelligenz durch Vehicle-to-Grid-Technologie auszugleichen

Auf einer Veranstaltung in San Francisco machte General Motors heute eine Reihe von Ankündigungen zu den Themen EV-Batterien, Energiespeicherung und Netzstabilität angesichts der wachsenden Stromnachfrage aus KI-Rechenzentren. Der Autohersteller und…

Infrastruktur· AWS ML· 10. Juni 2026· vor 2 Monaten■

Skalieren Sie das Lernen zur Roboterverstärkung mit NVIDIA Isaac Lab auf Amazon SageMaker AI

In diesem Beitrag zeigen wir, wie Sie Roboterrichtlinien für den Humanoiden Unitree H1 mit NVIDIA Isaac Lab auf Amazon SageMaker AI über zwei Rechenoptionen trainieren: Amazon SageMaker HyperPod und Amazon SageMaker Training Jobs.

Infrastruktur· OpenAI· 9. Juni 2026· vor 2 Monaten■

Was Codex für Notion freischaltet

Wie Notion Codex nutzt, um One-Shot-Spezifikationen zu erstellen, KI-Spracheingaben für das Web zu erstellen und die technische Leistung in kleinen Teams zu vervielfachen.

Infrastruktur· The Verge· 9. Juni 2026· vor 2 Monaten■

Amazon-Mitarbeiter fordern Seattle auf, den Bau neuer Rechenzentren zu bremsen

Am Dienstag wird der Stadtrat von Seattle darüber abstimmen, ob ein einjähriges Moratorium für neue Rechenzentren erlassen werden soll – nur zwei Monate nachdem mehrere Unternehmen den Bau von fünf großen Zentren in der Stadt vorgeschlagen hatten. Unter den Mo…

Infrastruktur· MarkTechPost· 9. Juni 2026· vor 2 Monaten▼

NVIDIA cuTile Python-Tutorial: Erstellen gekachelter GPU-Kernel für Vektoraddition, Matrixaddition und Matrixmultiplikation in Colab

In diesem Tutorial implementieren wir einen praktischen Workflow für NVIDIA cuTile Python, eine kachelbasierte GPU-Programmierschnittstelle für Kernel im CUDA-Stil in Python. Wir bereiten eine Colab-freundliche Umgebung vor und überprüfen GPU, Treiber, CUDA usw.

Infrastruktur· The Decoder· 9. Juni 2026· vor 2 Monaten▲

Intel erhält ein zweites Leben, da Google und Nvidia es als TSMC-Backup für KI-Chips erkunden

Google hat für 2028 mehr als drei Millionen KI-Chips bei Intel bestellt. Nvidia testet Intels Fertigungstechnologie für seine kommende Feynman-Architektur. Beide Schritte erfolgen, da TSMC mit der Nachfrage nach KI-Chips nicht Schritt halten kann. Int…

Infrastruktur· MarkTechPost· 9. Juni 2026· vor 2 Monaten▲

Xiaomi MiMo und TileRT bringen ein 1-Billion-Parameter-Modell auf Standard-GPUs auf über 1000 Token pro Sekunde

Das MiMo-Team von Xiaomi hat mit TileRT MiMo-V2.5-Pro-UltraSpeed veröffentlicht, einen Serviermodus für das MiMo-V2.5-Pro-Modell. Es dekodiert über 1000 Token pro Sekunde auf einem 1-Billion-Parameter-Modell unter Verwendung eines einzigen 8-GPU-Commodity-Knotens.…

Infrastruktur· AWS ML· 9. Juni 2026· vor 2 Monaten■

Erschließung der KI-Flexibilität in Europa: Ein Leitfaden zur regionsübergreifenden Inferenz für die Datenverarbeitung und den Modellzugriff in der EU

Da der Zugriff auf die neuesten generativen KI-Modelle und hochleistungsfähige beschleunigte Berechnungen weltweit stark nachgefragt werden, benötigen AWS-Kunden Tools, um die Modellverfügbarkeit und -kapazität in mehreren AWS-Regionen zu nutzen.

Infrastruktur· NVIDIA· 8. Juni 2026· vor 2 Monaten▲

NVIDIA und LG Group bauen eine KI-Fabrik, um physische KI, Mobilität und KI-Infrastruktur voranzutreiben

NVIDIA und die LG Group bauen eine KI-Fabrik, um die nächste Welle von KI-gesteuerten Unternehmen der LG Group zu beschleunigen, die Robotik, autonomes Fahren, Rechenzentrumstechnologien und GPU-Cloud-Dienste umfassen. Die KI-Fabrik wird beweisen…

Infrastruktur· The Decoder· 7. Juni 2026· vor 2 Monaten■

Anthropic wirbt den zweiten Chip-Ingenieur von OpenAI ab, während beide Unternehmen auf einen Börsengang zusteuern

Clive Chan, nach eigenen Angaben der zweite Hardware-Mitarbeiter im Custom-Chip-Programm von OpenAI, wechselt zu Anthropic. Er bringt Erfahrungen aus Teslas Autopilot ASIC und der OpenAI-Broadcom-Partnerschaft mit. Der Umzug kommt…

Infrastruktur· MarkTechPost· 7. Juni 2026· vor 2 Monaten▲

Mit der neuen Colab-CLI von Google können Entwickler und KI-Agenten Python auf Remote-GPUs und TPUs von Colab vom Terminal aus ausführen

Google hat die Colab-CLI veröffentlicht, mit der Entwickler und KI-Agenten lokalen Code auf der Remote-GPU und TPU-Laufzeit von Colab ausführen können. Der Beitrag Die neue Colab-CLI von Google ermöglicht es Entwicklern und KI-Agenten, Python auf Remote-GPUs und TPUs von Colab auszuführen.

Infrastruktur· The Decoder· 6. Juni 2026· vor 2 Monaten▲

Sakana AI geht davon aus, dass KI, die sich selbst verbessert, das Computer-Wettrüsten der Frontier Labs durchbrechen kann

Sakana AI hat ein spezielles Forschungslabor für rekursive Selbstverbesserung eingerichtet: KI, die sich iterativ selbst verbessert. Das japanische Startup, mitbegründet von Transformer-Co-Autor Llion Jones, sieht RSI als Alternative zu …

Infrastruktur· Ars Technica· 6. Juni 2026· vor 2 Monaten▼

„Wir haben viele Leute verärgert“: Riesiger Rechenzentrumsplan wurde aufgrund von Protesten um 50 % gekürzt

Der Entwickler fühlte sich „zusammengeschlagen“ und hatte „keine andere Wahl“, als das Rechenzentrum zu verkleinern.

Infrastruktur· MarkTechPost· 5. Juni 2026· vor 2 Monaten▲

NVIDIA AI veröffentlicht Nemotron 3 Ultra: einen offenen 550B-Experten-Hybrid-Mamba-Transformator für Agenten mit langer Laufzeit

NVIDIA hat Nemotron 3 Ultra veröffentlicht, einen offenen Mixture-of-Experts-Hybrid-Mamba-Transformer mit insgesamt 550 B (55 B aktiv) für Agenten mit langer Laufzeit. Es kombiniert einen 1-M-Token-Kontext mit einem bis zu ~6-mal höheren Inferenzdurchsatz als vergleichbare…

Infrastruktur· TechCrunch· 5. Juni 2026· vor 2 Monaten■

Meta stiehlt eine Taktik von Tesla und baut Rechenzentren in Zelten

Meta hat möglicherweise einen Weg gefunden, seine enormen Kosten für Rechenzentren zu senken: Zelte.

Infrastruktur· The Verge· 5. Juni 2026· vor 2 Monaten▼

Kevin O’Leary stimmt der Verkleinerung des riesigen Rechenzentrums in Utah zu

Kevin O'Leary stimmte zu, die Größe seines geplanten 40.000 Hektar großen Rechenzentrums in Utah zu halbieren, obwohl der Druck von Anwohnern und Aktivisten zunahm, wie zuvor von der lokalen Tochtergesellschaft ABC4 berichtet wurde. Der Shark Tank-Star schickte einen Brief an …

Infrastruktur· TechCrunch· 4. Juni 2026· vor 2 Monaten▲

Ist das Silicon Valley bereit, Roboter in die Häuser der Menschen einzubauen? Hallo Roboter ist.

Das kalifornische Startup brachte die vierte Generation seines Haushaltshilferoboters Stretch auf den Markt.

Infrastruktur· Ars Technica· 4. Juni 2026· vor 2 Monaten■

Wie einige Rechenzentrumsbetreiber ihre Wasserverbrauchsprobleme angehen

Hyperscaler werden auf ihre Auswirkungen auf die Wasserqualität und -verfügbarkeit untersucht.

Infrastruktur· IEEE Spectrum· 4. Juni 2026· vor 2 Monaten▲

Die klassischen Fortschritte, die nötig sind, um Quantencomputer zum Laufen zu bringen

Quantencomputer versprechen, eines Tages Probleme zu lösen, die über die leistungsstärksten Supercomputer hinausgehen, die man sich vorstellen kann. Allerdings wird oft unterschätzt, wie viel klassische Rechenleistung allein für den Betrieb dieser Maschinen erforderlich ist. Als Qubit zählen…

Infrastruktur· HotON Desk· 3. Juni 2026· vor 2 Monaten▼

Die regionale GPU-Kapazität nimmt ab, wenn neue Cluster online gehen

Neue Rechenzentrumskapazitäten in mehreren Regionen erleichterten die GPU-Verfügbarkeit und trugen dazu bei, die regionalen Inferenzkostenindizes diese Woche zu senken.

Infrastruktur· HotON Desk· 1. Juni 2026· vor 2 Monaten■

In zwei weiteren Regionen werden energiegebundene Computing-Preise eingeführt

Immer mehr Anbieter koppeln die Rechenpreise an die lokalen Energiebedingungen und fügen eine tageszeitliche Dimension hinzu, um zu bestimmen, wo und wann KI-Workloads am günstigsten laufen.

Infrastruktur· NVIDIA· 1. Juni 2026· vor 2 Monaten▲

Das NVIDIA AI Cloud-Ökosystem wird weltweit erweitert, um den globalen Bedarf an KI-Rechnern zu decken

Das NVIDIA AI Cloud-Ökosystem beschleunigt den globalen Aufbau der KI-Fabrik-Infrastruktur. Partner erweitern ihre Kapazitäten, um der wachsenden Nachfrage von Unternehmen, Startups, Nationen, KI-Laboren und Entwicklern gerecht zu werden.

Infrastruktur· VentureBeat· 12. Jan. 2026· vor 7 Monaten▲

Anthropic führt Cowork ein, einen Claude Desktop-Agenten, der in Ihren Dateien arbeitet – keine Programmierung erforderlich

Anthropic hat am Montag Cowork veröffentlicht, eine neue KI-Agentenfunktion, die die Leistungsfähigkeit seines äußerst erfolgreichen Claude Code-Tools auf technisch nicht versierte Benutzer ausdehnt – und Unternehmensinsidern zufolge hat das Team die gesamte Funktion entwickelt …

Zusammenfassungen werden nur zu Informationszwecken aggregiert – folgen Sie dem Quelllink für die vollständige Geschichte. Demo-Einträge dienen der Veranschaulichung.