コンピューティングの供給、GPU、データセンター、エネルギー - AI をいかに安価に実行できるかを決定する物理層。
28 のストーリー
コンピューティングの供給、エネルギー、データセンターの容量によって、AI をいかに安価に実行できるかが決まります。インフラストラクチャの変化は数週間後に推論コストに現れます。
中程度の規模のデータセンターであっても、局所的に甚大な影響を与える可能性があります。
The Information によると、OpenAI はオハイオ州に計画されている 10 ギガワットのデータセンターをリースする交渉を行っており、Nvidia から資金援助を受ける可能性があるという。記事 OpenAI はこれまでで最大のデータセンターを望んでおり、Nvidia は…
初期容量が 24 メガワットの革新的なデータセンターは、自然冷却システムとして海水を使用します。
OpenAIの新たな報告書では、米国の技術論争、データセンターの言説、関税、ChatGPTに関する虚偽の主張を標的とする、AIを利用した中国関連の影響力作戦について詳述している。
168 メガワットの施設は、Meta の世界的な AI コンピューティングのニーズをサポートし、時間の経過とともに拡張することができます。
Confidential Computing を備えた NVIDIA GPU は、Apple のデータセンターを超えて Google Cloud まで拡張される Apple のプライベート クラウド コンピューティング (PCC) での機密推論に使用されています。 Apple の年次 WWDC 集会中に発表されました…
本日、サンフランシスコで開催されたイベントで、ゼネラルモーターズは、AIデータセンターからの電力需要の増大に直面して、EVのバッテリー、エネルギー貯蔵、送電網の回復力に関する一連の発表を行った。自動車メーカーと…
この投稿では、Amazon SageMaker HyperPod と Amazon SageMaker トレーニング ジョブという 2 つのコンピューティング オプションにわたって、Amazon SageMaker AI 上の NVIDIA Isaac Lab を使用して Unitree H1 ヒューマノイドのロボット ポリシーをトレーニングする方法を示します。
シアトル市議会は火曜日、数社が市内に5つの大規模センターの建設を提案してからわずか2か月後、新規データセンターの1年間の一時停止を制定するかどうかを投票する予定だ。中でも…
Notion が Codex を使用してワンショット仕様を作成し、Web 用の AI 音声入力を構築し、小規模チーム全体でエンジニアリング能力を倍増させる方法。
このチュートリアルでは、Python の CUDA スタイル カーネル用のタイルベースの GPU プログラミング インターフェイスである NVIDIA cuTile Python の実践的なワークフローを実装します。 Colab に適した環境を準備し、GPU、ドライバー、CUDA などをチェックします。
Googleは、2028年に向けてIntelに300万以上のAIチップを発注した。Nvidiaは、次期ファインマンアーキテクチャ向けにIntelの製造技術をテストしている。どちらの動きも、TSMCがAIチップの需要に追いつけないために起こった。インター…
Xiaomi の MiMo チームは、TileRT と協力して、MiMo-V2.5-Pro モデルのサービング モードである MiMo-V2.5-Pro-UltraSpeed をリリースしました。単一の 8 GPU コモディティ ノードを使用して、1 兆パラメータ モデルで 1 秒あたり 1000 を超えるトークンをデコードします。
最新の生成 AI モデルと世界的に需要の高い高性能アクセラレーション コンピューティングにアクセスできるため、AWS の顧客は、複数の AWS リージョンにわたってモデルの可用性とキャパシティを活用するためのツールを必要としています。
NVIDIA と LG グループは、ロボティクス、自動運転、データセンター テクノロジー、GPU クラウド サービスに及ぶ LG グループの AI 主導型ビジネスの次の波を加速するために、AI ファクトリーを構築しています。 AI ファクトリーが証明するのは…
OpenAI のカスタム チップ プログラムにおける 2 人目のハードウェア従業員である Clive Chan 氏は、自身の説明によると、Anthropic に異動する予定です。彼は、Tesla の Autopilot ASIC と OpenAI と Broadcom のパートナーシップで得た経験をもたらします。この動きは…
Google が Colab CLI をリリースし、開発者と AI エージェントがリモート Colab GPU および TPU ランタイムでローカル コードを実行できるようにしました The post Google の新しい Colab CLI により、開発者と AI エージェントはリモート Colab GPU および TPU ランタイムで Python を実行できるようになりました…
Sakana AI has launched a dedicated research lab for recursive self-improvement: AI that iteratively improves itself. The Japanese startup, co-founded by Transformer co-author Llion Jones, sees RSI as an alternative to t…
Developer felt "beaten up," with "no choice" but to shrink data center.
NVIDIA has released Nemotron 3 Ultra, a 550B total (55B active) open Mixture-of-Experts hybrid Mamba-Transformer for long-running agents. It pairs a 1M-token context with up to ~6x higher inference throughput than compa…
Meta may have found one way to slash its massive data center bill: tents.
Kevin O'Leary agreed to halve the size of his planned 40,000-acre data center in Utah amid mounting pressure from residents and activists, as reported earlier by local affiliate ABC4. The Shark Tank star sent a letter t…
The California startup released the fourth-generation of its home assistance robot, Stretch.
Hyperscalers have come under scrutiny for their impact on water quality and availability.
Fresh data-center capacity in several regions eased GPU availability, helping push regional inference cost indices lower this week.
More providers are tying compute prices to local energy conditions, adding a time-of-day dimension to where and when AI workloads run cheapest.
The NVIDIA AI Cloud ecosystem is accelerating the global buildout of AI factory infrastructure. Partners are expanding capacity to meet growing demand from enterprises, startups, nations, AI labs and developers scaling…
Anthropic released Cowork on Monday, a new AI agent capability that extends the power of its wildly successful Claude Code tool to non-technical users — and according to company insiders, the team built the entire featu…
概要は情報提供のみを目的としてまとめられています。全文についてはソース リンクを参照してください。デモのエントリは一例です。