Infrastructure

Infrastructure d'IA

Fourniture de calcul, GPU, centres de données et énergie : la couche physique qui décide du fonctionnement à moindre coût de l'IA.

Histoires 189

Toutes les actualités Lancements de modèles Tarifs Infrastructure Politique Financement et fusions et acquisitions Source ouverte

Pourquoi c'est important

L’approvisionnement informatique, l’énergie et la capacité du centre de données déterminent le coût de fonctionnement de l’IA. Les changements d’infrastructure apparaissent dans les coûts d’inférence des semaines plus tard.

Infrastructure· Hacker News· 29 juil. 2026· il y a 18 heures■

Les stocks de puces chutent alors que la vente de l’IA s’intensifie

URL de l'article : https://www.ft.com/content/f8c03b5b-e194-4236-82c3-389b6f5dd7ae URL des commentaires : https://news.ycombinator.com/item?id=49087537 Points : 34 # Commentaires : 5

Infrastructure· TechCrunch· 28 juil. 2026· il y a 20 heures▼

Les centres de données pourraient être confrontés à des coupures de courant temporaires pour éviter des pannes sur le plus grand réseau américain

Cette décision intervient alors que le rythme effréné de la construction des centres de données pousse les opérateurs de réseau à se démener pour produire de l'électricité.

Infrastructure· The Decoder· 28 juil. 2026· il y a 23 heures▼

Taïwan arrête un employé de Nvidia dans le cadre d'une enquête élargie sur la contrebande de puces en Chine

Les procureurs taïwanais ont arrêté un employé de Nvidia dans le cadre d'une prétendue exportation illégale de serveurs Super Micro AI vers la Chine, selon Bloomberg et Reuters. L'article Taïwan arrête un employé de Nvidia dans w…

Infrastructure· ZDNet· 28 juil. 2026· il y a 23 heures■

Vous avez mal utilisé votre batterie externe, et les règles des compagnies aériennes le montrent clairement

La plupart des choses que vous n'êtes pas autorisé à faire à bord d'un avion sont des choses que vous ne devriez pas faire du tout.

Infrastructure· MIT Tech Review· 28 juil. 2026· hier■

Les travailleurs des puces de Samsung quittent le navire pour rivaliser avec SK Hynix

Lee, ingénieur à la division semi-conducteurs de Samsung, pointe la fin de son quart de travail. Il travaillait de plus longues heures, faisant un effort supplémentaire pour exceller dans ses projets. Mais dernièrement, il rentre directement à la maison pour travailler sur son…

Infrastructure· AI News· 28 juil. 2026· hier■

Le pari de l’Arménie sur l’IA n’est pas la fabrication de puces. C'est la souveraineté du calcul

L'Arménie n'est pas un grand pays. Ce n'est pas un pays riche. Ce n’est pas un pays célèbre. Et pourtant, il n’est pas seulement devenu consommateur de différents produits d’IA à l’image du générateur de sous-titres Clideo pour le montage vidéo, ou des géants Li…

Infrastructure· The Verge· 28 juil. 2026· avant-hier▲

Pourquoi la Chine offre ses meilleurs modèles d'IA

Des visiteurs visitent le stand de Kimi, un LLM développé par la startup chinoise Moonshot, lors de la World AI Conference à Shanghai, en Chine, le 20 juillet. | Image : LONG WEI/Feature Chine/Future Publishing via Getty Images Silicon…

Infrastructure· TechCrunch· 27 juil. 2026· avant-hier▲

Dynamisez votre infrastructure d'IA ! Un premier aperçu de l'agenda Smart Systems Stage à TechCrunch Disrupt 2026

Lors de TechCrunch Disrupt 2026, la scène des systèmes intelligents sera le lieu où l'énergie, l'infrastructure et la technologie entreront en collision, couvrant tout, des percées en matière de fusion à la pression sur le réseau que l'IA exerce sur l'ensemble de l'économie.

Infrastructure· ZDNet· 27 juil. 2026· avant-hier■

Comment fonctionneraient les centres de données d’IA dans l’espace ? Un ancien chef de la robotique de la NASA explique

« Vous collectez de l'électricité dans l'espace et vous éjectez de la chaleur dans l'espace. La seule chose qui arrive sur Terre, ce sont les données.

Infrastructure· NVIDIA· 27 juil. 2026· avant-hier▲

NVIDIA exploite le processeur Vera pour accélérer la conception de processeurs et de GPU de nouvelle génération

La complexité de la conception des puces modernes continue de croître à mesure que les équipes d’ingénierie travaillent au développement de processeurs, de GPU et de systèmes d’IA de plus en plus sophistiqués. Pour aider à relever ce défi, NVIDIA collabore avec le leader du secteur…

Infrastructure· TechCrunch· 27 juil. 2026· il y a 3 jours■

Donner un sens à la panique suscitée par l’IA chinoise

Dans le dernier épisode d'Equity, nous avons expliqué pourquoi Kimi de Moonshot AI semblait paniquer la Silicon Valley et Wall Street.

Infrastructure· MarkTechPost· 26 juil. 2026· il y a 4 jours■

Conception de noyaux GPU hautes performances avec TileLang : Tensor-Core GEMM, Fused Softmax, FlashAttention et Autotuning

Explorez TileLang, un langage Python de haut niveau spécifique à un domaine qui simplifie la conception de noyaux GPU hautes performances. Ce didacticiel fournit une approche étape par étape pour implémenter des charges de travail complexes, notamment en mosaïque…

Infrastructure· TechCrunch· 25 juil. 2026· il y a 4 jours▲

Une ligne électrique tombée a révélé un problème croissant de centre de données IA. Voici comment y remédier.

Un appel rapproché en Virginie du Nord a révélé à quel point les centres de données réagissent mal aux perturbations du réseau. Voici comment résoudre le problème.

Infrastructure· ZDNet· 25 juil. 2026· il y a 4 jours■

Le nouveau Galaxy Z Fold 8 Ultra de Samsung est impressionnant, mais ce n'est pas le produit phare qui m'attire

Le Samsung Galaxy Z Fold 8 Ultra est un bon téléphone, mais il y a quelque chose de bien plus convaincant dans le Galaxy Z Fold 8.

Infrastructure· ZDNet· 25 juil. 2026· il y a 4 jours■

Samsung Galaxy Z Fold 8 Ultra vs Z Fold 7 : après un an d'utilisation, je suis prêt à mettre à niveau

Avec le dernier téléphone pliable de Samsung, la société propose des modifications de conception et de logiciel qui font que même le Z Fold de l'année dernière semble insuffisant.

Infrastructure· MarkTechPost· 25 juil. 2026· il y a 4 jours▼

Datalab Marker v2 vs MinerU, Docling et Liteparse : analyse de référence

Datalab a réécrit Marker en tant que pipeline à trois modes. La version 2 atteint 76,0 sur olmOCR-bench et prend en charge 2,9 pages par seconde sur un B200, soit plus de 5 fois le backend du pipeline de MinerU, tout en battant Docling en termes de précision et de vitesse. H…

Infrastructure· MarkTechPost· 25 juil. 2026· il y a 4 jours■

Marker 2 de Datalab vs MinerU, Docling et LiteParse : 76,0 sur le banc olmOCR à 5 × le débit de MinerU

Infrastructure· Hacker News· 25 juil. 2026· il y a 5 jours▲

AMD et Cerebras lancent une solution d'inférence IA

URL de l'article : https://www.cerebras.ai/press-release/amd-and-cerebras-announce-industry-leading-ultra-low-latency-and-high-throughput-ai-inference URL des commentaires : https://news.ycombinator.com/item?id=49041347 Points : 17 # C…

Infrastructure· Ars Technica· 24 juil. 2026· il y a 5 jours■

Les entreprises d’IA veulent plus de centres de données ; L'EPA de Trump pourrait donner moins de poids à ses voisins

La règle permettrait aux États de décider dans quelle mesure, le cas échéant, le public peut contribuer.

Infrastructure· MarkTechPost· 24 juil. 2026· il y a 5 jours■

Comment créer un pipeline OCR de bout en bout avec l'OCR illimité de Baidu pour les images haute résolution et l'analyse PDF multipage

Dans ce didacticiel, nous construisons un flux de travail complet pour exécuter le modèle Unlimited-OCR de Baidu sur des images de documents et des PDF de plusieurs pages. De la configuration de l'environnement GPU à la comparaison de l'inférence Gundam en mosaïque très détaillée et de la rapidité…

Infrastructure· Hacker News· 24 juil. 2026· il y a 6 jours■

De l’Australie à l’IA : produisez plus d’énergie que vous n’en brûlez et mettez fin au « vol » de contenu

URL de l'article : https://www.theregister.com/ai-and-ml/2026/07/15/australia-demands-ai-companies-must-produce-more-energy-than-they-consume-stop-theft-of-content/5271535 URL des commentaires : https://news.ycombinator.com/item?id=49…

Infrastructure· IEEE Spectrum· 23 juil. 2026· il y a 6 jours■

La NASA met en orbite le grand modèle linguistique Gemma de Google

La viabilité des centres de données orbitaux hébergeant les grands modèles de langage (LLM) les plus grands et les plus performants reste vivement contestée. Mais les énormes déploiements qui nécessitent des milliers de GPU ne sont pas le seul moyen par lequel les LLM peuvent prospérer…

Infrastructure· The Verge· 23 juil. 2026· il y a 6 jours▲

Les baby-boomers de droite qui protestent contre les centres de données ont de nombreux points communs avec la gauche

Une personne tient des pancartes lors d'une manifestation nationale contre l'expansion du centre de données d'IA à l'extérieur du Peace Hall à New Port Richey, en Floride. | AFP via Getty Images Par un samedi matin gris et humide dans le centre de la Floride, un peu un peu…

Infrastructure· NVIDIA· 23 juil. 2026· il y a 6 jours▲

Le supercalculateur NVIDIA AI est mis en ligne à la Naval Postgraduate School

Le fondateur et PDG de NVIDIA, Jensen Huang, a visité aujourd'hui la Naval Postgraduate School de Monterey, en Californie, pour mettre en service un système NVIDIA DGX GB300, mettant ainsi l'une des plates-formes d'IA les plus puissantes au monde entièrement en ligne pour...

Infrastructure· Hacker News· 22 juil. 2026· il y a 7 jours■

La plupart des Américains disent "pas dans mon jardin" aux centres de données IA

URL de l'article : https://www.redfin.com/news/ai-data-centers-opposition-education-benefit/ URL des commentaires : https://news.ycombinator.com/item?id=49007525 Points : 39 # Commentaires : 53

Infrastructure· ZDNet· 22 juil. 2026· il y a 7 jours■

Samsung Galaxy Z Fold 8 Ultra contre Google Pixel Fold 10 Pro : vous ne pouvez pas perdre, mais voici mon choix surprise

Le Samsung Galaxy Z Fold 8 Ultra possède toute la puissance brute dont vous avez besoin, mais le prix et les accessoires du Google Pixel 10 Pro Fold pourraient constituer une meilleure offre.

Infrastructure· OpenAI· 22 juil. 2026· il y a 7 jours■

Faire progresser la prochaine ère de la science nationale

OpenAI souligne son engagement à faire progresser la science américaine en travaillant avec le département américain de l'Énergie et les laboratoires nationaux pour utiliser l'IA de pointe pour accélérer les découvertes.

Infrastructure· AI News· 22 juil. 2026· il y a 7 jours▲

Le projet Galaxy de SenseTime vise la mise à l’échelle nationale des puces d’IA

SenseTime a lancé le projet Galaxy, en s'associant avec près de 20 partenaires pour faire évoluer l'infrastructure nationale des puces d'IA en Chine. Dans un discours intitulé « Transformation intelligente et symbiose », Yang Fan, co-fondateur de l'entreprise…

Infrastructure· The Verge· 22 juil. 2026· il y a 7 jours■

Les sociétés de services publics promettent de nous épargner la facture énergétique de l’IA

L’engagement a été introduit en mars et n’a jusqu’à présent pas fait grand-chose pour apaiser les inquiétudes. | Image : Cath Virginia / The Verge, Getty Images Face aux réactions négatives suscitées par les inquiétudes, le boom de l'IA augmentera les factures d'électricité des consommateurs…

Infrastructure· TechCrunch· 22 juil. 2026· il y a 8 jours■

Les centres de données devraient consommer 4 fois plus d’électricité d’ici 2035

Les nouveaux centres de données construits jusqu’en 2033 pourraient consommer autant d’électricité que l’Inde en consomme aujourd’hui.

Infrastructure· Hacker News· 22 juil. 2026· il y a 8 jours■

Les modèles d'IA de Meta alimentent la première vague de projets Genesis Mission

https://www.energy.gov/undersecretaryforscience/genesis-miss... URL des commentaires : https://news.ycombinator.com/item?id=48995074 Points : 84 # Commentaires : 56

Infrastructure· NVIDIA· 21 juil. 2026· il y a 8 jours■

Conçu pour Vera Rubin, NVIDIA Spectrum-6 arrive dans les usines d'IA Gigascale

L’IA est entrée dans l’ère du gigascale. Les usines d'IA les plus avancées au monde rassemblent des centaines de milliers de GPU et de CPU pour former des modèles de pointe, alimenter l'IA agentique et générer de l'intelligence à un niveau sans précédent…

Infrastructure· WIRED· 21 juil. 2026· il y a 8 jours■

Nvidia veut posséder chaque puce dans les centres de données IA

La plate-forme Vera Rubin de Nvidia combine CPU et GPU en un seul système, reflétant l'ambition croissante de l'entreprise d'alimenter chaque couche de l'infrastructure d'IA.

Infrastructure· TechCrunch· 21 juil. 2026· il y a 9 jours■

Google travaille sur une nouvelle puce IA conçue pour rendre Gemini plus efficace

Alphabet, la société mère de Google, travaillerait sur une nouvelle puce conçue pour rendre ses modèles Gemini beaucoup plus efficaces.

Infrastructure· The Decoder· 21 juil. 2026· il y a 9 jours▲

La puce "Frozen v2" de Google aurait intégré l'architecture de Gemini directement dans le silicium pour des gains d'efficacité

Google développe "Frozen v2", une puce serveur qui intègre l'architecture Gemini directement dans le matériel. Selon des sources internes, il pourrait être 6 à 10 fois plus performant que les TPU actuels. Prévu pour 2028, le…

Infrastructure· AWS ML· 21 juil. 2026· il y a 9 jours■

Comment Couchbase a construit une architecture d'IA multimodèle pour Capella iQ avec Amazon Bedrock

Cet article décrit comment Couchbase a adopté Amazon Bedrock pour alimenter Capella iQ avec la famille de modèles Claude d'Anthropic, les décisions architecturales derrière leur approche multimodèle et les avantages opérationnels réalisés…

Infrastructure· The Decoder· 21 juil. 2026· il y a 9 jours■

L'emprise de Nvidia sur les puces IA s'affaiblit à mesure que Microsoft se tourne vers AMD et Anthropic pourrait suivre

Microsoft étend l'infrastructure d'IA d'Azure avec la nouvelle plate-forme Helios d'AMD, qui devrait concurrencer les systèmes GPU de Nvidia au second semestre 2026. Un profil GitHub public suggère qu'Anthropic teste également AMD…

Infrastructure· NVIDIA· 20 juil. 2026· il y a 9 jours▲

Bristol Myers Squibb construit l'usine d'IA la plus avancée du secteur des sciences de la vie sur NVIDIA Vera Rubin

Erin Davis l'appelle le « SuperDuperPOD ». Cela représente deux choses en un seul nom : le géant pharmaceutique Bristol Myers Squibb (BMS) gère déjà l’un des plus grands clusters d’IA dans les sciences de la vie, avec de sérieux résultats à montrer.…

Infrastructure· The Verge· 20 juil. 2026· il y a 9 jours▲

La Chine donne un double coup de poing à la domination américaine de l’IA

Les principales sociétés chinoises d'IA augmentent la pression sur la Silicon Valley, alors que Moonshot et Alibaba ont dévoilé des modèles qui, selon eux, peuvent rivaliser avec le meilleur d'OpenAI et d'Anthropic à une fraction du prix. Le rap…

Infrastructure· MarkTechPost· 19 juil. 2026· il y a 10 jours▲

Affiner Qwen3 avec LoRA à l'aide de NVIDIA NeMo AutoModel : un didacticiel complet sur le flux de travail Google Colab à GPU unique

Nous construisons un flux de travail NVIDIA NeMo AutoModel de bout en bout dans Google Colab à l'aide d'un seul GPU. Nous vérifions le matériel CUDA et la prise en charge de précision, installons NeMo AutoModel à partir des sources et chargeons une recette officielle Qwen3-0.6B LoRA. W…

Infrastructure· TechCrunch· 18 juil. 2026· il y a 11 jours■

Neil Rimer pense que l'argent de l'IA va revenir

Neil Rimer, l'investisseur en capital-risque qui a cofondé Index Ventures, prédit que la richesse historique générée par l'IA dans la Silicon Valley devra être redistribuée, volontairement ou involontairement.

Infrastructure· The Decoder· 18 juil. 2026· il y a 12 jours■

Le projet de Zuckerberg de vendre ses excédents de calcul d'IA pourrait trouver son premier gros client chez Anthropic

Meta serait en pourparlers avec Anthropic pour louer la capacité de calcul de ses centres de données. L'article Le projet de Zuckerberg de vendre ses excédents de calcul d'IA pourrait trouver son premier gros client dans Anthropic apparaît en premier sur Th…

Infrastructure· The Decoder· 18 juil. 2026· il y a 12 jours▲

Tout comme Deepseek, le chinois Kimi K3 oblige les laboratoires d'IA occidentaux à remettre en question leur avantage informatique

Moonshot AI a publié Kimi K3, un modèle qui, selon les premières évaluations, correspond à l'Opus 4.8 d'Anthropic, construit par une équipe de seulement 300 personnes. Même le stratège OpenAI, Dean W. Ball, le qualifie de « très bon », mais prévient bien sûr que…

Infrastructure· ZDNet· 18 juil. 2026· il y a 12 jours▲

Ce Levoit est le meilleur purificateur d'air intelligent que j'ai testé (et il est en promotion)

Le Levoit Vital 200S-P est le purificateur d'air intelligent à battre, avec un préfiltre lavable et une capacité de nettoyer jusqu'à 1 800 pieds carrés en une heure.

Infrastructure· ZDNet· 17 juil. 2026· il y a 12 jours▲

J'ai testé cette centrale électrique de secours lors d'une véritable panne de courant - ne faites pas d'erreurs

Une véritable panne de courant de trois jours a révélé des problèmes que je n'aurais jamais trouvés sur la fiche technique d'une centrale électrique.

Infrastructure· OpenAI· 17 juil. 2026· il y a 12 jours■

Un tableau de bord pour l’ère de l’IA

Sarah Friar, directrice financière d'OpenaAI, présente un tableau de bord pratique de l'IA pour mesurer le retour sur investissement grâce au travail utile, au coût par tâche réussie, à la fiabilité et au retour sur le calcul.

Infrastructure· Simon Willison· 17 juil. 2026· il y a 12 jours▲

Repérez les oiseaux, pas le golf

<p>Suggestion pour les hyperscalers qui ressentent une pression sur la consommation d'eau des centres de données :</p> <p>Achetez quelques country clubs exclusifs, convertissez les terrains de golf en parcs publics, payez des guides et des jumelles pour obtenir le membre précédent…

Infrastructure· WIRED· 17 juil. 2026· il y a 13 jours▲

Pourquoi Apple a poursuivi OpenAI, New York s'attaque aux centres de données et ce qu'il faut savoir sur la cyclosporose

Dans l'Uncanny Valley d'aujourd'hui, nous examinons le drame en cours d'OpenAI, à la fois juridique et réputationnel, et voyons si ces développements pourraient nuire davantage à l'entreprise, en particulier dans sa lutte contre l'anthropisme.

Infrastructure· VentureBeat· 17 juil. 2026· il y a 13 jours■

L’écart de calcul de l’IA : les entreprises achètent des infrastructures plus rapidement qu’elles ne peuvent en mesurer le coût

Dans 107 entreprises, les dépenses en infrastructures d’IA s’accélèrent bien avant la capacité de voir ou d’orienter ses aspects économiques. La plupart des organisations exécutent leur IA sur une base familière d’hyperscalers et d’API de fournisseurs de modèles, mais…

Infrastructure· MarkTechPost· 16 juil. 2026· il y a 13 jours■

Guide du SDK Patter pour créer un agent téléphonique de réservation de restaurant avec des variables dynamiques, des garde-corps, des tableaux de bord de latence et des contrôles d'évaluation

Nous explorons le SDK Patter en créant un flux de travail d'agent vocal pour un cas d'utilisation de réservation de restaurant. Nous définissons des variables d'appelant dynamiques, enregistrons des outils appelables pour la disponibilité, les réservations, les heures et le transfert humain, et laissons…

Infrastructure· NVIDIA· 16 juil. 2026· il y a 14 jours▲

NVIDIA présente de nouveaux ordinateurs Jetson Thor pour faire progresser la robotique grand public et l'IA Edge

Les robots à usage général et les machines autonomes passent des laboratoires de recherche au déploiement réel sur le marché de masse, créant une demande pour des supercalculateurs d'IA compacts et économes en énergie, capables d'exécuter des modèles de base à t…

Infrastructure· AWS ML· 16 juil. 2026· il y a 14 jours■

Built Technologies crée une solution d'intelligence documentaire basée sur l'IA sur AWS pour alimenter les agents du secteur du financement immobilier

Construit en partenariat avec l'AWS Generative AI Innovation Center (GenAIIC), le partenaire AWS AND Digital et les équipes de comptes AWS pour créer un moteur de traitement de documents évolutif, alimenté par l'IA, qui peut classer, diviser, extraire, évaluer…

Infrastructure· ZDNet· 15 juil. 2026· il y a 14 jours▲

Quatre mois avec ma première batterie domestique m'ont appris ce que signifie réellement la sauvegarde dans toute la maison

Le Solix E10 d'Anker a rendu l'alimentation de secours compréhensible pour ce débutant, et j'ai hâte d'étendre le système.

Infrastructure· TechCrunch· 14 juil. 2026· il y a 15 jours▲

L'État de New York arrête la construction de tous les nouveaux centres de données

New York est devenu le premier État à suspendre temporairement l'approbation des grands centres de données, comme le gouverneur Kathy Hochul affirme que le boom de la construction basé sur l'IA ne devrait pas se faire au détriment de la hausse des coûts de l'électricité, de l'approvisionnement en eau,…

Infrastructure· Ars Technica· 14 juil. 2026· il y a 15 jours■

New York interdit la construction de centres de données pendant un an, ce qui ébranle l'industrie de l'IA

Le moratoire sur les centres de données de New York pourrait devenir le modèle du mouvement anti-IA.

Infrastructure· NVIDIA· 14 juil. 2026· il y a 15 jours■

Pourquoi la performance par watt est la mesure ultime pour l'efficacité de l'infrastructure d'IA

La puissance est la contrainte incontournable de l’infrastructure d’IA. Le nombre de jetons qu’une usine d’IA peut générer dans le cadre d’un budget énergétique fixe détermine ses revenus et sa rentabilité. Pour cette raison, la performance par watt – une mesure qui…

Infrastructure· The Verge· 14 juil. 2026· il y a 15 jours■

Demis Hassabis, de Google, déclare qu'il est temps de créer un organisme de surveillance mondial de l'IA, dirigé par les États-Unis.

Demis Hassabis, lors d'une table ronde au Forum économique mondial de Davos, en Suisse. | Image : Bloomberg via Getty Images Demis Hassabis pense que le monde a besoin d'un chien de garde de l'IA avec le pouvoir de freiner en cas de…

Infrastructure· Hacker News· 14 juil. 2026· il y a 15 jours■

Une famille géorgienne dit qu'elle est obligée de vendre sa maison pour alimenter des centres de données IA

URL de l'article : https://www.cbsnews.com/news/georgia-power-ai-data-centers-eminent-domain/ URL des commentaires : https://news.ycombinator.com/item?id=48901420 Points : 19 # Commentaires : 4

Infrastructure· TechCrunch· 14 juil. 2026· il y a 16 jours▼

Satya Nadella a lancé un avertissement choquant aux entreprises utilisant l'IA

Parmi tous les débats qui font rage sur les inconvénients potentiels de l’IA, il y a une inquiétude qui suscite le plus d’inquiétude parmi les passionnés d’IA de la Silicon Valley : les laboratoires d’IA géants qui vendent des modèles propriétaires sont en quelque sorte un…

Infrastructure· ZDNet· 13 juil. 2026· il y a 16 jours■

Les meilleurs ordinateurs tout-en-un de 2026 : testés et examinés par des experts

Nous avons testé les meilleurs ordinateurs tout-en-un combinant la puissance d’un ordinateur de bureau avec un design fin et léger.

Infrastructure· The Verge· 12 juil. 2026· il y a 17 jours▼

La lutte contre les centres de données IA ne fait que commencer

Un panneau de signalisation s'opposant à un centre de données prévu est affiché le long de la route 54 dans le comté de Northumberland du canton de Mount Carmel. | Image : Getty Images Voici The Stepback, une newsletter hebdomadaire décrivant une histoire essentielle de…

Infrastructure· MarkTechPost· 12 juil. 2026· il y a 18 jours▼

Un guide de codage pour la programmation GPU basée sur les tuiles de NVIDIA : des noyaux cuTile et Triton à Flash Attention

Dans ce didacticiel, nous explorons la programmation GPU basée sur des tuiles NVIDIA avec TileGym, en créant un flux de travail Colab qui s'exécute sur différents matériels. Nous sondons l'environnement CUDA, essayons le vrai backend cuTile et revenons à Tr…

Infrastructure· The Decoder· 11 juil. 2026· il y a 18 jours▲

OpenAI admet qu'il "n'a pas tout fait correctement" avec le lancement de ChatGPT Work et se démène pour corriger l'UX et les coûts

Suite au lancement de ChatGPT Work et de GPT-5.6 Sol, OpenAI a reconnu des problèmes importants : une utilisation excessive du calcul, une transition déroutante vers l'interface de bureau pour les discussions et les projets, une distinction peu claire entre...

Infrastructure· Hacker News· 11 juil. 2026· il y a 19 jours■

Les modèles d’IA ouverts de la Chine font progresser sa puissance douce mondiale

URL de l'article : https://www.noemamag.com/chinas-open-ai-models-are-advancing-its-global-soft-power/ URL des commentaires : https://news.ycombinator.com/item?id=48865717 Points : 17 # Commentaires : 0

Infrastructure· AWS ML· 10 juil. 2026· il y a 19 jours■

Déploiement de modèles quantifiés sur Amazon SageMaker AI avec Unsloth

Dans cet article, vous découvrirez quatre modèles de déploiement pour prendre des modèles déjà quantifiés avec Unsloth et les déployer sur l'infrastructure AWS. Les modèles utilisent Amazon Elastic Compute Cloud (Amazon EC2)…

Infrastructure· The Verge· 10 juil. 2026· il y a 19 jours▲

Souhaitez-vous héberger une partie d’un centre de données IA chez vous ?

Une entreprise de stockage d'énergie solaire et domestique se développe dans les centres de données d'IA, mais pas en en construisant un : elle propose plutôt de payer ses clients pour qu'ils installent ses unités de calcul chez eux. Sunrun lance un programme pilote…

Infrastructure· ZDNet· 10 juil. 2026· il y a 19 jours■

Les meilleurs services d'hébergement VPS pour 2026 : testés et examinés par des experts

Si vous avez besoin de plus de puissance que ce que les services d'hébergement partagé peuvent fournir, les meilleurs fournisseurs d'hébergement VPS peuvent vous fournir les ressources dédiées et l'évolutivité nécessaires pour faire passer votre projet au niveau supérieur.

Infrastructure· TechCrunch· 10 juil. 2026· il y a 20 jours▲

OpenAI déclare que GPT 5.6 est le « modèle préféré » pour Microsoft Copilot 365 au milieu des discussions sur la rupture

La nouvelle famille de modèles d'OpenAI continuera à alimenter la suite d'applications de travail et de productivité de Microsoft.

Infrastructure· MarkTechPost· 10 juil. 2026· il y a 20 jours▲

Découvrez Nemotron Labs 3 Puzzle 75B A9B : un LLM MoE hybride compressé offrant un débit de serveur 2,03x

NVIDIA a publié Nemotron-Labs-3-Puzzle-75B-A9B, une variante compressée de Nemotron-3-Super. Iterative Puzzle alterne la compression structurelle sensible au matériel avec de courtes phases de récupération de distillation de connaissances. Le mode…

Infrastructure· TechCrunch· 10 juil. 2026· il y a 20 jours■

Nvidia est victime du marché informatique qu'il a créé

Ayant prouvé à quel point le calcul peut être précieux, l’entreprise se retrouve au centre d’un marché dans lequel tout le monde veut être – tandis que des technologies plus simples et des entreprises moins intéressantes s’enrichissent en marge.

Infrastructure· Hacker News· 9 juil. 2026· il y a 20 jours■

DeepSeek vise à créer sa propre puce IA

URL de l'article : https://www.proactiveinvestors.com/companies/news/1095178/deepseek-makes-pivot-that-should-put-silicon-valley-on-high-alert-1095178.html URL des commentaires : https://news.ycombinator.com/item?id=48846708 Points : 4…

Infrastructure· NVIDIA· 9 juil. 2026· il y a 20 jours▲

GeForce NOW fait monter la pression avec le nouveau serveur Toronto alimenté par GeForce RTX 5080

Ce jeudi GFN apporte plus de jeux, plus de puissance et plus de façons de jouer sur GeForce NOW. Le service de jeu en nuage s'étend avec un nouveau serveur alimenté par GeForce RTX 5080 à Toronto, offrant des performances élevées dédiées dans le…

Infrastructure· MarkTechPost· 9 juil. 2026· il y a 20 jours▲

NVIDIA lance Nemotron-Labs-3-Puzzle-75B-A9B : un LLM MoE hybride compressé offrant un débit de serveur 2,03x avec un débit utilisateur correspondant

Infrastructure· TechCrunch· 8 juil. 2026· il y a 21 jours■

L'ancien directeur d'OpenAI, Kevin Weil, siège désormais au conseil d'administration de Stoke Space.

Le nouveau rôle de Kevin Weil chez Stoke Space suggère que les fusées réutilisables sont la prochaine nouveauté dans la Silicon Valley.

Infrastructure· ZDNet· 8 juil. 2026· il y a 21 jours■

Pourquoi laisser les rallonges branchées en permanence est plus risqué que vous ne le pensez

Bien sûr, les rallonges et les multiprises domestiques sont pratiques, mais elles entraînent également des milliers d’incendies évitables chaque année. Voici comment les utiliser de manière plus sûre.

Infrastructure· Ars Technica· 8 juil. 2026· il y a 22 jours■

La demande énergétique des centres de données menace le plan « Made in America » de Trump

La réduction des factures d’électricité de la Ceinture de rouille menace le plan manufacturier de Trump.

Infrastructure· TechCrunch· 8 juil. 2026· il y a 22 jours▼

Microsoft rejoint la tendance à la réduction des coûts de l'IA en s'appuyant davantage sur ses propres modèles

Microsoft est le dernier géant de la Silicon Valley à réduire ses dépenses en IA.

Infrastructure· The Decoder· 7 juil. 2026· il y a 22 jours▲

Deepseek conçoit sa propre puce IA

La startup chinoise Deepseek construit sa propre puce d'IA, rapporte Reuters. L'article Deepseek conçoit sa propre puce IA est apparu en premier sur The Decoder.

Infrastructure· MarkTechPost· 7 juil. 2026· il y a 22 jours▼

OpenAI lance GPT-Realtime-2.1 et GPT-Realtime-2.1-mini pour les agents vocaux à faible latence dans l'API

OpenAI a ajouté deux modèles en temps réel à son API. GPT-Realtime-2.1-mini est un mini modèle de raisonnement pour la voix, dont le prix est identique au précédent gpt-realtime-mini. OpenAI a également réduit la latence p95 d'au moins 25 % grâce à une mise en cache améliorée. Il…

Infrastructure· ZDNet· 6 juil. 2026· il y a 23 jours■

Claude Fable 5 est de retour, mais je m'en tiens à l'Opus 4.8 pour le travail quotidien : 5 raisons pour lesquelles

Fable 5 d'Anthropic promet une puissance d'IA mythique, mais des restrictions surprises me font me demander si cela pose plus de problèmes que cela n'en vaut la peine pour une utilisation quotidienne.

Infrastructure· Hacker News· 5 juil. 2026· il y a 24 jours■

La concentration du pouvoir dans l'IA est un risque, par Andy Konwinski

URL de l'article : https://xcancel.com/i/article/2072830533739192560 URL des commentaires : https://news.ycombinator.com/item?id=48792463 Points : 17 # Commentaires : 1

Infrastructure· Hacker News· 5 juil. 2026· il y a 25 jours■

Le regroupement de jetons de raisonnement du Codex GPT-5.5 peut entraîner une dégradation des performances

URL de l'article : https://github.com/openai/codex/issues/30364 URL des commentaires : https://news.ycombinator.com/item?id=48789428 Points : 131 # Commentaires : 41

Infrastructure· Hacker News· 3 juil. 2026· il y a 26 jours■

Les centres de données d’IA utilisent plus d’eau que ne le rapportent la plupart des géants de la technologie

URL de l'article : https://www.wsj.com/tech/ai/ai-data-centers-water-use-901e2902 URL des commentaires : https://news.ycombinator.com/item?id=48774246 Points : 18 # Commentaires : 6

Infrastructure· IEEE Spectrum· 3 juil. 2026· il y a 26 jours■

L’utilisation volatile de l’énergie de l’IA teste silencieusement les limites du réseau

L’expansion rapide des infrastructures d’intelligence artificielle est généralement présentée comme un problème énergétique. Les centres de données devraient consommer une part croissante de la demande mondiale d’électricité : L’Agence internationale de l’énergie…

Infrastructure· TechCrunch· 3 juil. 2026· il y a 27 jours■

Anthropic discute d'une nouvelle puce personnalisée avec Samsung

La nouvelle arrive environ une semaine après qu'OpenAI a annoncé sa propre puce d'IA personnalisée en partenariat avec Broadcom.

Infrastructure· The Decoder· 3 juil. 2026· il y a 27 jours■

Anthropic aurait exploré la fabrication de puces personnalisées avec Samsung tout en insistant sur le fait que Nvidia compte toujours

Anthropic serait en pourparlers avec Samsung Electronics sur la fabrication d'une puce IA personnalisée. Le projet en est encore à ses débuts, mais Anthropic a déjà embauché des ingénieurs en puces. Après « Jalapeño » d’OpenAI, encore une autre IA majeure…

Infrastructure· ZDNet· 2 juil. 2026· il y a 27 jours■

Enfin un robot aspirateur laveur sans odeur qui n'a aucun problème à manipuler les poils de mon animal

L'Eufy Omni S2 améliore son prédécesseur avec une puissance d'aspiration quatre fois supérieure et un rouleau de vadrouille sans odeur.

Infrastructure· The Decoder· 2 juil. 2026· il y a 27 jours▲

Nvidia finance des startups d'IA pour relâcher l'emprise des Big Tech sur son activité de puces

Nvidia agit de plus en plus comme une banque centrale pour les startups d’IA, façonnant activement le marché du calcul. L'article Nvidia finance des startups d'IA pour desserrer l'emprise des Big Tech sur son activité de puces, apparu en premier sur The…

Infrastructure· Ars Technica· 2 juil. 2026· il y a 27 jours■

Le développement de l’IA de Google a entraîné une augmentation de 37 % de la consommation d’électricité en 2025

Google essaie d'équilibrer les émissions des centres de données d'IA avec des efforts en matière d'énergie propre.

Infrastructure· Hacker News· 2 juil. 2026· il y a 27 jours■

Une entreprise de méta-construction cloud pour vendre des capacités excédentaires d'IA

URL de l'article : https://www.reuters.com/business/meta-sell-excess-ai-computing-capacity-via-cloud-business-bloomberg-news-reports-2026-07-01/ URL des commentaires : https://news.ycombinator.com/item?id=48759329 Points : 26 # Commentaire…

Infrastructure· NVIDIA· 2 juil. 2026· il y a 27 jours■

NVIDIA débloque le calcul de l'IA à grande échelle, en invitant les partenaires financiers à alimenter le développement de l'infrastructure de l'IA

À mesure que l’IA passe du développement de modèles à l’inférence de production, la demande de calcul s’accélère et s’oriente vers des usines d’IA fonctionnant en continu et générant des jetons à grande échelle. Ce changement nécessite l’accès à des ressources à grande échelle…

Infrastructure· TechCrunch· 2 juil. 2026· il y a 28 jours▲

Ashton Kutcher quitte Sound Ventures pour lancer une nouvelle société de capital-risque avec Morgan Beller

Sound a bâti sa réputation sur des paris concentrés et à forte conviction dans des laboratoires d'IA de premier plan, tandis que le nouveau fonds de Kutcher semble s'attaquer à la couche sous-jacente à ces entreprises : l'infrastructure et l'énergie qui alimentent…

Infrastructure· IEEE Spectrum· 2 juil. 2026· il y a 28 jours▲

Alors que l’IA remodèle les systèmes énergétiques mondiaux, Melbourne joue un rôle de leader grâce à la collaboration en matière d’ingénierie

Cet article vous est présenté par le Melbourne Convention Bureau (MCB) soutenu par Business Events Australia. Alors que l’intelligence artificielle accélère la demande mondiale de calcul, une contrainte parallèle émerge avec autant…

Infrastructure· TechCrunch· 1 juil. 2026· il y a 28 jours▲

Meta, comme SpaceX, cherche à transformer les calculs excédentaires de l'IA en espèces

Meta développe des plans pour une entreprise d’infrastructure cloud, vendant l’accès à la puissance de calcul et aux modèles d’IA. Cette décision l'opposerait aux grands fournisseurs de cloud comme Amazon Web Services, Google Cloud et Microsoft Az…

Infrastructure· Hacker News· 1 juil. 2026· il y a 28 jours■

Meta crée une entreprise cloud pour vendre les excédents de calcul d'IA

URL de l'article : https://www.bloomberg.com/news/articles/2026-07-01/meta-is-building-a-cloud-business-to-sell-excess-ai-compute URL des commentaires : https://news.ycombinator.com/item?id=48745966 Points : 15 # Commentaires : 11

Infrastructure· IEEE Spectrum· 1 juil. 2026· il y a 28 jours■

La machine à battage médiatique du centre de données orbital est déjà en orbite

"L'endroit le moins coûteux pour implanter l'IA sera dans l'espace, et ce sera vrai d'ici deux ans, peut-être trois au plus tard", a déclaré le fondateur de SpaceX, Elon Musk, au Forum économique mondial de Davos en janvier dernier, alors que son entreprise était en train de...

Infrastructure· The Decoder· 1 juil. 2026· il y a 29 jours▼

OpenAI aurait réduit de plus de moitié les coûts de réponse pour les utilisateurs invités de ChatGPT

Selon un rapport de The Information, OpenAI a réduit de plus de moitié les coûts d’inférence pour ses modèles d’IA. La société a appliqué les optimisations à ChatGPT, où le nombre de GPU Nvidia nécessaires est tombé à seulement une fe…

Infrastructure· NVIDIA· 1 juil. 2026· il y a 29 jours■

NVIDIA BioNeMo Agent Toolkit apporte une IA accélérée aux chercheurs en sciences de la vie chez Claude Science

Les sciences de la vie sont entrées dans une ère de calcul à grande échelle et, depuis plus d'une décennie, NVIDIA a construit la pile informatique complète accélérée par GPU, couvrant le matériel, les frameworks, les bibliothèques, les modèles, les microservices et les domaines…

Infrastructure· AWS ML· 1 juil. 2026· il y a 29 jours■

Comment Outpost VFX utilise AWS pour accélérer la formation des modèles d'IA pour les effets visuels

Dans cet article, nous explorons comment Outpost VFX a atteint des vitesses de formation 8 fois plus rapides en utilisant l'infrastructure AWS pour transformer son flux de travail de remplacement de visage, l'architecture technique qu'ils ont mise en œuvre pour surmonter la limite d'un seul GPU…

Infrastructure· The Decoder· 30 juin 2026· il y a 29 jours▲

Taïwan perquisitionne les bureaux de Super Micro dans le cadre d'une enquête sur la contrebande de puces Nvidia vers la Chine

Les autorités taïwanaises ont perquisitionné les bureaux de Super Micro Computer et de plusieurs sociétés partenaires locales. L'article Taïwan perquisitionne les bureaux de Super Micro dans le cadre d'une enquête sur la contrebande de puces Nvidia vers la Chine est apparu en premier sur The…

Infrastructure· Hacker News· 30 juin 2026· il y a 29 jours■

Pourquoi l’Europe ne construira-t-elle pas de centres de données d’IA en Islande ?

URL de l'article : https://mrkt30.com/why-wont-europe-build-ai-data-centers-in-iceland/ URL des commentaires : https://news.ycombinator.com/item?id=48727538 Points : 27 # Commentaires : 22

Infrastructure· ZDNet· 30 juin 2026· le mois dernier■

Je garde toujours ces 3 appareils branchés sur ma centrale électrique - voici pourquoi

Voici comment tirer parti des capacités de votre centrale électrique en dehors d’une situation d’urgence.

Infrastructure· AI News· 29 juin 2026· le mois dernier■

xFusion fait évoluer l'IA d'entreprise des postes de travail périphériques aux centres de données refroidis par liquide

xFusion a présenté des modèles informatiques d'IA d'entreprise évolutifs à l'ISC 2026, faisant passer le matériel des appareils de pointe aux centres de données. Les acheteurs de technologies d'entreprise présents au salon de Hambourg recherchaient une production pratique…

Infrastructure· Hacker News· 29 juin 2026· le mois dernier■

Un agent IA déclenche une frappe nucléaire après avoir été déjoué dans Civilization VI

URL de l'article : https://decrypt.co/371877/ai-agent-nuclear-strike-civilization-vi-benchmark URL des commentaires : https://news.ycombinator.com/item?id=48712791 Points : 15 # Commentaires : 2

Infrastructure· ZDNet· 28 juin 2026· le mois dernier■

J'ai vécu avec de l'énergie solaire à la maison pendant des années - 12 mythes que vous pouvez ignorer en toute sécurité en 2026

Connaître les faits sur l'énergie solaire domestique peut vous aider à faire de meilleurs choix informés, à économiser de l'argent et à rester en sécurité.

Infrastructure· The Decoder· 28 juin 2026· le mois dernier■

Une entreprise chinoise de cybersécurité construit des outils d'IA pour rivaliser avec Mythos et présente la course comme une dissuasion cybernucléaire

Le fondateur de 360, Zhou Hongyi, présente deux outils de sécurité IA conçus pour rivaliser avec Mythos d'Anthropic. On a déjà signalé 3 432 vulnérabilités. Zhou admet que les modèles chinois sont en retard de 20 à 30 pour cent sur les modèles occidentaux, mais c…

Infrastructure· TechCrunch· 28 juin 2026· le mois dernier■

Le PDG de SoftBank n’est pas le seul à se poser des questions sur le battage médiatique des centres de données orbitaux d’Elon Musk

Tout le monde n’adhère pas à la vision d’Elon Musk concernant les centres de données orbitaux.

Infrastructure· Hacker News· 27 juin 2026· le mois dernier■

Demandez à HN : MacBook vs GPU dédié pour LLM

Pour ceux qui utilisent LLMS sur MacBook, vous voulez comprendre en quoi le MacBook est différent du GPU dédié lors de l'exécution de ces modèles ? et comment savoir à quel point un macbook est capable de faire tourner un modèle ? URL des commentaires : https://ne…

Infrastructure· TechCrunch· 27 juin 2026· le mois dernier▲

Pourquoi tout le monde, d'OpenAI à SpaceX, construit ses propres puces (et fait monter la pression sur Nvidia)

Nvidia domine le marché des puces IA depuis des années, mais l’ère de la dépendance totale pourrait toucher à sa fin. OpenAI vient de partager ses projets pour pimenter les choses avec Jalapeño, sa puce d'inférence personnalisée construite avec Broadcom, rejoignant G…

Infrastructure· TechCrunch· 26 juin 2026· le mois dernier▲

La puce Jalapeño d’OpenAI est l’évolution la plus épicée des Big Tech par rapport à Nvidia

Infrastructure· WIRED· 26 juin 2026· le mois dernier■

Anthropic pense que son propre succès est essentiel pour rendre l'IA sécurisée

Les critiques d'Anthropic affirment qu'elle accumule rapidement du pouvoir. L'entreprise dit que c'est ainsi que devrait se présenter le développement responsable de l'IA.

Infrastructure· WIRED· 26 juin 2026· le mois dernier▼

Pourquoi Amazon a abandonné son projet de film avec OpenAI, les employés des centres de données réagissent et Meta fuit des données des employés

La décision de MGM Studios, propriété d'Amazon, d'abandonner le projet de film avec OpenAI est seulement une partie de l'intégration croissante de l'IA et de l'industrie cinématographique. Sur Uncanny Valley, nous examinons où tout cela va en fin de compte.

Infrastructure· ZDNet· 26 juin 2026· le mois dernier▲

Tous les MacBooks et iPads touchés par des hausses de prix surprises - même le Neo n'a pas été épargné

Les hausses de prix sont le résultat de la flambée des coûts des puces de mémoire et du courtage, mais il reste des offres disponibles si vous savez où chercher.

Infrastructure· TechCrunch· 26 juin 2026· le mois dernier▼

L'ancien chef de la division IA de Databricks pense qu'il peut réduire la facture d'énergie de l'IA de 1 000 fois

Un-0 est un outil de système de génération d'images qui montre pour la première fois comment la technologie de l'entreprise peut reproduire des systèmes d'IA conventionnels.

Infrastructure· ZDNet· 25 juin 2026· le mois dernier■

J'ai trouvé 5 offres GPU de Prime Day à saisir maintenant - avant de payer le prix complet

C'est un marché difficile pour les GPU, mais il reste encore quelques bonnes affaires à saisir pendant Amazon Prime Day. Voici les cinq à vérifier.

Infrastructure· The Verge· 25 juin 2026· le mois dernier▲

Ford a dû embaucher à nouveau des anciens ingénieurs pour corriger les erreurs commises par ses systèmes automatisés

Pour célébrer son nouveau statut de N°1 dans le classement initial de qualité de JD Power parmi les constructeurs automobiles principaux, Ford ouvre un peu plus sur les défis qu'il a rencontrés ces dernières années, en particulier autour de sa dépendance aux systèmes automatisés...

Infrastructure· OpenAI· 25 juin 2026· le mois dernier▲

Concevoir des organisations capables de suivre le rythme de l'IA

Pourquoi la latence organisationnelle devient le principal obstacle à la pleine exploitation des avantages de l’IA

Infrastructure· The Decoder· 25 juin 2026· le mois dernier■

Qualcomm entre sur le marché des data centers avec son propre processeur

Qualcomm s'implante davantage sur le marché des data centers avec un nouveau processeur appelé Dragonfly C1000. L'article Qualcomm entre sur le marché des data centers avec son propre processeur a été publié en premier sur The Decoder.

Infrastructure· Ars Technica· 25 juin 2026· le mois dernier■

IBM revendique la première technologie de puce sous-1 nanomètre au monde

Les transistors nanostack d'IBM pourraient améliorer les performances ou l'efficacité énergétique des puces.

Infrastructure· AI News· 25 juin 2026· le mois dernier■

Les mathématiques derrière le chip Jalapeño d'OpenAI

La trajectoire financière d'OpenAI dépend fortement des coûts d'infrastructure, une réalité qui a conduit au développement du nouveau chip personnalisé OpenAI Jalapeño. Développé en collaboration avec Broadcom, ce chip intégré spécifique à l'application...

Infrastructure· Ars Technica· 25 juin 2026· le mois dernier▲

OpenAI et Broadcom annoncent un puce conçu pour l'inference à l'échelle des LLM

La course aux semi-conducteurs s'intensifie au milieu de la lutte pour répondre à la demande.

Infrastructure· MarkTechPost· 25 juin 2026· le mois dernier▲

Gradium lance stt-translate et s2s-translate, Modèles de Traduction de Parole en Temps Réel Dépassant gpt-realtime-translate en Termes d'Exactitude et de Latence

Gradium a lancé deux modèles de traduction de parole en temps réel, stt-translate et s2s-translate, couvrant l'anglais, le français, l'allemand, l'espagnol et le portugais sur 20 paires de langues. Les modèles réduisent le standard des trois modèles…

Infrastructure· TechCrunch· 25 juin 2026· le mois dernier■

OpenAI dévoile son premier processeur personnalisé, construit par Broadcom

Annonce : https://openai.com/index/openai-broadcom-jalapeno-inference-... https://decrypt.co/371971/openai-broadcom-jalapeno-first-cus... https://www.cnn.com/2026/06/24/tech/openai-broadcom-jalapeno... Lien des commentaires :…

Infrastructure· AWS ML· 25 juin 2026· le mois dernier▲

Comment Loka a construit un agent vocal naturel et à faible latence avec Amazon Nova 2 Sonic

Dans cet article, nous démontrons l'architecture et l'approche utilisée par Loka pour résoudre une frustration courante : des assistants vocaux robotiques et lents qui font que les clients raccrochent, endommagent la réputation de la marque et augmentent les coûts de support.

Infrastructure· The Verge· 24 juin 2026· le mois dernier■

OpenAI révèle son premier processeur IA : Jalapeño

OpenAI a récemment révélé un nouveau "processeur d'intelligence" en puce pour les serveurs IA, fabriqué en partenariat avec Broadcom. La puce, appelée Jalapeño, est conçue pour alimenter les modèles de grande taille actuels et futurs, selon une an…

Infrastructure· The Decoder· 24 juin 2026· le mois dernier■

OpenAI et Broadcom dévoilent "Jalapeño", un processeur personnalisé conçu pour l'inference des modèles de langage grand format

OpenAI ajoute de l'équipement personnalisé à son stack technologique. Le processeur "Jalapeño", développé avec Broadcom, est conçu pour l'inference des modèles de langage grand format et est prévu pour fonctionner à grande échelle d'ici la fin de 2026. L'article OpenAI et Broadcom u…

Infrastructure· Hacker News· 24 juin 2026· le mois dernier■

OpenAI et Broadcom dévoilent un processeur d'inférence optimisé pour les LLM

Lien de l'article: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ Lien des commentaires: https://news.ycombinator.com/item?id=48659257 Points: 141 # Commentaires: 1

Infrastructure· The Decoder· 24 juin 2026· le mois dernier■

Le PDG de Pangram dit que les modèles de langage se dévoilent en avançant les mêmes arguments

Les modèles de langage peuvent écrire un texte plus clair que la plupart des humains, mais demandez-en 100 arguments sur un sujet et ils se regrouperont tous. Le raisonnement humain est beaucoup plus diversifié, dit le PDG de Pangram Max Spero, et c'est cela qui pourrait…

Infrastructure· MarkTechPost· 24 juin 2026· le mois dernier▲

DFlash Drafte des Blocs de Symboles Entiers en Parallèle pour une Vitesse de Débit Jusqu’à 15x Supérieure sur NVIDIA Blackwell

Le DFlash de l’Université de Californie à San Diego remplace le brouillon autoregressif par un modèle de diffusion de blocs léger pour la décodage spéculatif. Il dessine des blocs de symboles entiers en un seul passage avant et conditionne sur des caractéristiques cachées cibles…

Infrastructure· OpenAI· 24 juin 2026· le mois dernier■

OpenAI et Broadcom dévoilent un chip d'inférence optimisé pour les LLM

OpenAI et Broadcom introduisent Jalapeño, un chip AI personnalisé conçu pour l'inférence des LLM pour améliorer les performances, l'efficacité et l'échelle des systèmes AI.

Infrastructure· NVIDIA· 24 juin 2026· le mois dernier■

NVIDIA et AWS collaborent pour apporter l'IA à l'échelle de production

La construction de systèmes d'IA à l'échelle est exigeante, nécessitant une inference à faible latence, une recherche vectorielle rapide, une forte performance prix/GPU et une infrastructure qui peut croître sans multiplier la complexité opérationnelle. La dernière innovation de NVIDIA...

Infrastructure· MarkTechPost· 24 juin 2026· le mois dernier■

Comment utiliser NVIDIA Canary-1B-v2 pour la transcription automatique, la traduction et l'exportation automatique de sous-titres SRT en Python

Dans ce tutoriel, nous construisons un pipeline de transcription automatique et de traduction multilingue avec NVIDIA Canary-1B-v2. Nous chargeons le modèle sur un runtime avec GPU, préparons l'audio en mono 16 kHz et exécutons une transcription anglaise. Nous traduisons ensuite…

Infrastructure· Hacker News· 23 juin 2026· le mois dernier▲

Show HN : Le Graph Cascade – Une carte interactive des contraintes de l'IA et de l'énergie

Bonjour, je voulais partager avec vous tous une carte interactive des contraintes économiques et physiques du déploiement de l'IA. Elle comporte des moteurs macroscopiques, des goulets d'étranglement industriels et où cela se manifeste sur les marchés. J'ai ajouté 393 nœuds...

Infrastructure· NVIDIA· 23 juin 2026· le mois dernier▲

NVIDIA alimente plus de 400 des 500 supercalculateurs les plus rapides du monde

Points de actualité : La technologie NVIDIA fonctionne sur 81% du TOP500 et 90% des systèmes nouveaux de la liste. 26 systèmes du TOP500 ont adopté le CPU NVIDIA Grace, soit huit de plus que la liste précédente. Les huit systèmes les plus puissants sur la Gree…

Infrastructure· AI News· 23 juin 2026· le mois dernier▲

Les plus grandes agences de renseignement annoncent que les menaces cybernétiques liées à l'IA affecteront les entreprises dans les mois à venir. Voici pourquoi

L'augmentation mondiale des menaces cybernétiques liées à l'IA n'est plus un problème éloigné pour les centres de données des entreprises, selon un avertissement public urgent de l'alliance de renseignement la plus puissante du monde. Le 22 juin 2026, la cybersécurité...

Infrastructure· OpenAI· 23 juin 2026· le mois dernier■

Comment Omio construit l'avenir du voyage conversationnel

Découvrez comment Omio utilise OpenAI pour propulser les expériences de voyage conversationnel, accélérer le développement de produits et se transformer en entreprise native de l'IA.

Infrastructure· The Verge· 23 juin 2026· le mois dernier▲

Nvidia dit que son design de centre de données IA fonctionne plus chaud pour utiliser beaucoup moins d'eau

Le retour d'expérience public contre les centres de données a mis en avant leur consommation d'eau et d'énergie, et Nvidia met en avant son affirmation selon laquelle le design de référence de la génération Rubin pour un centre de données complètement refroidi par liquide a "élim…

Infrastructure· TechCrunch· 23 juin 2026· le mois dernier▼

Nvidia souhaite réduire la consommation d'eau des data centers, mais ce n'est pas la même chose que de résoudre le problème de l'eau de l'IA

Nvidia a annoncé un nouveau système de refroidissement qui réduit la consommation d'eau à l'intérieur des data centers. Mais cela ne fait rien pour résoudre l'utilisation la plus importante de l'eau par l'IA, à savoir les centrales électriques au fuel fossile.

Infrastructure· The Decoder· 23 juin 2026· le mois dernier■

Microsoft construit un centre de données de 2 gigawatts au Texas avec sa propre centrale à gaz pour contourner le réseau

Microsoft construit un campus de centre de données d'environ 2 gigawatts à Pecos, au Texas, l'une des plus grandes augmentations de capacité unique dans son histoire. Dans une lettre ouverte, l'entreprise promet des prix de l'énergie stables et une consommation minimale d'eau, d…

Infrastructure· NVIDIA· 22 juin 2026· le mois dernier▲

À l'ISC, JUPITER montre à quoi ressemble la science exascale

JUPITER, le premier supercalculateur exascale d'Europe, installé au Forschungszentrum Jülich en Allemagne, fonctionne avec des Superchips Grace Hopper de NVIDIA et un réseau InfiniBand Quantum-X800 de NVIDIA — et il a eu une année chargée. Comme l'international…

Infrastructure· NVIDIA· 22 juin 2026· le mois dernier▲

NVIDIA Vera CPU Ouvre la Voie pour l'IA Scientifique Agente au Laboratoire National du Los Alamos

Mission, Vision et Véritas — les nouveaux supercalculateurs du Laboratoire National du Los Alamos (LANL) à construire avec HPE et NVIDIA — utilisent les CPU NVIDIA Vera pour accélérer la découverte scientifique, déverrouillant l'IA agente pour la science.…

Infrastructure· NVIDIA· 22 juin 2026· le mois dernier■

Eco Wave Power Transforme les Vagues en Watts Grâce à l'Infrastructure de l'IA NVIDIA et les Doubles Numériques

La prochaine ère de l'IA ne sera pas définie uniquement par le calcul. Sa croissance sera déterminée par l'énergie. Alors que le calcul accéléré s'échelle à travers les usines d'IA, l'IA agente, l'IA industrielle, le calcul aux bords et l'IA physique, incluant...

Infrastructure· WIRED· 22 juin 2026· le mois dernier■

Certains électriciens pensent que la construction de centres de données est une trahison

Les géants du numérique injectent de grosses sommes d'argent dans la construction de centres de données. Alors que l'opposition nationale à ces installations s'intensifie, certains travailleurs commencent à se demander s'il en vaut la peine.

Infrastructure· MarkTechPost· 20 juin 2026· le mois dernier■

Comment construire une pipeline de prévision avec TimeCopilot en utilisant des modèles de base et la détection automatique des anomalies

Nous construisons un flux de travail de prévision complet avec TimeCopilot sur un ensemble de données réelles de passagers d'airlines et une série saisonnière synthétique avec des anomalies injectées. Nous évaluons des statistiques, des modèles de base et des options basées sur GPU...

Infrastructure· TechCrunch· 19 juin 2026· le mois dernier▼

Les États-Unis disent que l'outil de puise à puces le plus avancé d'ASML pourrait être en Chine. ASML dit que ce n'est pas le cas

Il y a une logique commerciale qui va à l'encontre de l'idée que ASML prendrait le risque de son licence d'exportation pour équiper un client chinois.

Infrastructure· AWS ML· 19 juin 2026· le mois dernier■

Surveillez et déboguez les inférences d'IA générative avec les métriques détaillées et le tableau de bord Insights de SageMaker sur CloudWatch

Amazon SageMaker AI fournit un hébergement d'inférence en temps réel géré intégralement pour les modèles de machine learning. Vous déployez un modèle vers un point de terminaison SageMaker soutenu par une ou plusieurs instances de calcul, et SageMaker s'occupe de la fourniture…

Infrastructure· NVIDIA· 18 juin 2026· le mois dernier■

Synchronisation et Streaming : GeForce NOW Connecte aux Bibliothèques de Jeux des Membres Sur Tous les Appareils

Jouez à vos titres préférés provenant de bibliothèques de jeux populaires, conservez votre progression synchronisée et revenez aux sessions de jeu sur pratiquement n'importe quel appareil. C'est la puissance du jeu en nuage GeForce NOW. De fournir l'accès aux titres préférés des membres…

Infrastructure· IEEE Spectrum· 18 juin 2026· le mois dernier■

Les ondes sonores offrent aux puces neuromorphiques un avantage simulant le cerveau

En imitant le fonctionnement du cerveau, l'informatique neuromorphique peut utiliser beaucoup moins d'énergie que les puces AI électroniques conventionnelles. Cependant, même les appareils neuromorphiques les plus avancés d'aujourd'hui sont encore assez simples,...

Infrastructure· NVIDIA· 18 juin 2026· le mois dernier■

La France accélère l'avenir de l'IA en Europe avec les technologies NVIDIA

L'année dernière lors de NVIDIA GTC Paris à VivaTech, la France a détaillé ses plans pour promouvoir l'IA locale - des nouvelles usines d'IA et de la capacité de calcul national aux modèles frontière ouverts et aux plateformes industrielles. Maintenant, cette infrastructure d'IA...

Infrastructure· TechCrunch· 18 juin 2026· le mois dernier■

Tiffany Luck de NEA dit que les entreprises sont encore en train de comprendre leur retour sur investissement en IA

Tokenmaxxing était la tendance la plus populaire à Silicon Valley au début de l'année, avec des PDG incitant les employés à pousser l'utilisation de l'IA aussi loin que possible. Puis la facture est venue. Uber aurait épuisé son budget annuel en IA, selon des rapports…

Infrastructure· TechCrunch· 18 juin 2026· le mois dernier■

Tiffany Luck de NEA sur les IPO de l'IA, les agents personnels et le calcul du retour sur investissement

Tokenmaxxing était la tendance la plus en vogue en Silicon Valley au début de l'année, avec des PDG incitant leurs employés à pousser l'utilisation de l'IA aussi loin que possible. Puis, la facture est venue. Selon des informations, Uber aurait épuisé son budget annuel en IA...

Infrastructure· Ars Technica· 17 juin 2026· le mois dernier■

Anthropic "met en pause" la facturation basée sur les jetons pour son Claude Agent SDK

Le déplacement prévu pour lundi aurait fortement augmenté les coûts des utilisateurs intensifs.

Infrastructure· AWS ML· 17 juin 2026· le mois dernier▲

Présentation du cache de conteneurs dans Amazon SageMaker AI pour une mise à l'échelle plus rapide des modèles

Aujourd'hui, nous sommes ravis d'annoncer le cache d'image de conteneur pour l'inference Amazon SageMaker AI, la prochaine avancée majeure dans notre voyage d'optimisation de mise à l'échelle plus rapide. Cela accélère la latence du bout en bout jusqu'à 2 fois pour les généra…

Infrastructure· The Verge· 17 juin 2026· le mois dernier▲

Le dernier processeur de Qualcomm suggère que des lunettes intelligentes plus puissantes pourraient être en route

Les lunettes intelligentes sont encore une catégorie naissante, mais le fabricant de puces Qualcomm travaille dur pour améliorer le silicium pour alimenter la prochaine vague de dispositifs XR : le Snapdragon Reality Elite. Bien que Qualcomm annoncent ce processeur aujourd'hui…

Infrastructure· TechCrunch· 16 juin 2026· le mois dernier■

Le DOJ affirme que les turbines à gaz non autorisées de xAI sont une question de ‘sécurité nationale, économique et énergétique’

Le ministère de la Justice dit que le Pentagone a besoin que xAI continue d'utiliser ses turbines à gaz non autorisées.

Infrastructure· WIRED· 16 juin 2026· le mois dernier■

L'utilisation de tokens ‘très folle’ teste les paris des patrons sur l'IA

Un fabricant de logiciels de la Silicon Valley et une entreprise de commerce électronique révèlent à WIRED comment ils naviguent dans le défi émergent de la ‘tokenomics’。”“

Infrastructure· MIT Tech Review· 16 juin 2026· le mois dernier■

Vous voulez mettre en ligne un centre de données rapidement ? Donnez-lui un peu de flexibilité.

À la fin d'une première mi-temps tendue et sans but entre l'équipe masculine anglaise et l'Allemagne rivale, des millions de Britanniques ont laissé éclater un soupir collectif et ont fait ce qu'ils font si souvent en moments de stress : Ils ont...

Infrastructure· The Verge· 15 juin 2026· le mois dernier▲

Le PDG de Skydio, Adam Bry, sur pourquoi la Silicon Valley ne devrait pas tracer de lignes rouges pour l'utilisation des drones

Aujourd'hui, je parle avec Adam Bry, qui est le PDG de Skydio, le principal fabricant américain de drones autonomes. Avant d'enregistrer cet épisode, j'ai en fait pu opérer à distance un drone de Skydio dans la région de la Baie d'Hollywood depuis le bureau d'Adam…

Infrastructure· The Decoder· 14 juin 2026· il y a 2 mois■

La Mirage de Microsoft Research donne à la génération de vidéos une mémoire spatiale persistante qui ne oublie pas ce qui se trouve autour du coin

Mirage, un modèle de monde vidéo de Microsoft Research et plusieurs universités, stocke l'information de la scène directement dans l'espace latent au lieu de points nuage basés sur les pixels. Cela réduit le temps de calcul et la mémoire graphique tout en...

Infrastructure· Ars Technica· 13 juin 2026· il y a 2 mois▼

En ce qui concerne la consommation totale d’eau, les centres de données IA ne sont qu’une goutte d’eau dans l’océan

Même les centres de données de taille moyenne peuvent avoir un impact local démesuré.

Infrastructure· The Decoder· 10 juin 2026· il y a 2 mois■

OpenAI veut son plus grand centre de données à ce jour, et Nvidia soutiendrait la facture

OpenAI négocie la location d'un centre de données prévu de 10 gigawatts dans l'Ohio qui pourrait être soutenu financièrement par Nvidia, selon The Information. L'article OpenAI veut son plus grand centre de données à ce jour, et Nvidia serait…

Infrastructure· WIRED· 10 juin 2026· il y a 2 mois■

La Chine ouvre le premier centre de données sous-marin alimenté par l’énergie éolienne au monde

D'une capacité initiale de 24 mégawatts, le centre de données innovant utilise l'eau de mer comme système de refroidissement naturel.

Infrastructure· OpenAI· 10 juin 2026· il y a 2 mois■

Les opérations d’influence liées à la RPC ciblent les débats sur l’IA aux États-Unis

Un nouveau rapport d'OpenAI détaille les opérations d'influence liées à la RPC utilisant l'IA pour cibler les débats technologiques américains, les récits des centres de données, les tarifs et les fausses déclarations sur ChatGPT.

Infrastructure· IEEE Spectrum· 10 juin 2026· il y a 2 mois▼

Une astuce de timing réduit l'énergie utilisée dans la formation LLM jusqu'à 14 %

Le quatrième grand modèle linguistique (LLM) d’OpenAI, GPT-4, a nécessité environ 50 gigawattheures pour s’entraîner, soit l’équivalent de la consommation électrique annuelle de 5 000 foyers américains. C’était en 2023. Depuis, les ressources informatiques…

Infrastructure· TechCrunch· 10 juin 2026· il y a 2 mois▲

Meta signe le premier accord de centre de données IA en Inde avec Reliance

L'installation de 168 mégawatts répondra aux besoins mondiaux en matière de calcul d'IA de Meta et pourra être étendue au fil du temps.

Infrastructure· NVIDIA· 10 juin 2026· il y a 2 mois■

NVIDIA Confidential Computing pour aider à développer le cloud computing privé d'Apple

Les GPU NVIDIA avec Confidential Computing sont désormais utilisés pour l’inférence confidentielle dans le Private Cloud Compute (PCC) d’Apple, à mesure qu’il s’étend au-delà des centres de données d’Apple jusqu’à Google Cloud. Dévoilé lors du rassemblement annuel WWDC d’Apple…

Infrastructure· The Verge· 10 juin 2026· il y a 2 mois■

GM pense que les véhicules électriques peuvent aider à compenser la consommation d’énergie de l’IA grâce à la technologie véhicule-réseau

Lors d'un événement à San Francisco aujourd'hui, General Motors a fait une série d'annonces concernant les batteries de véhicules électriques, le stockage d'énergie et la résilience du réseau face à la demande croissante d'électricité des centres de données d'IA. Le constructeur automobile et…

Infrastructure· AWS ML· 10 juin 2026· il y a 2 mois■

Faites évoluer l'apprentissage par renforcement des robots avec NVIDIA Isaac Lab sur Amazon SageMaker AI

Dans cet article, nous montrons comment former des stratégies de robot pour l'humanoïde Unitree H1 avec NVIDIA Isaac Lab sur Amazon SageMaker AI à travers deux options de calcul : Amazon SageMaker HyperPod et Amazon SageMaker Training Jobs.

Infrastructure· OpenAI· 9 juin 2026· il y a 2 mois■

Ce que le Codex débloque pour Notion

Comment Notion utilise Codex pour créer des spécifications uniques, créer une entrée vocale IA pour le Web et multiplier la puissance d'ingénierie au sein de petites équipes.

Infrastructure· The Verge· 9 juin 2026· il y a 2 mois■

Les employés d'Amazon demandent à Seattle de freiner les nouveaux centres de données

Mardi, le conseil municipal de Seattle votera sur l'opportunité d'adopter un moratoire d'un an sur les nouveaux centres de données - deux mois seulement après que plusieurs entreprises ont proposé de construire cinq centres à grande échelle dans la ville. Parmi les mo…

Infrastructure· MarkTechPost· 9 juin 2026· il y a 2 mois▼

Tutoriel NVIDIA cuTile Python : Création de noyaux GPU en mosaïque pour l'addition de vecteurs, l'ajout de matrice et la multiplication de matrice dans Colab

Dans ce didacticiel, nous implémentons un flux de travail pratique pour NVIDIA cuTile Python, une interface de programmation GPU basée sur des tuiles pour les noyaux de style CUDA en Python. Nous préparons un environnement convivial pour Colab et vérifions le GPU, le pilote, CUDA,…

Infrastructure· The Decoder· 9 juin 2026· il y a 2 mois▲

Intel obtient une seconde vie alors que Google et Nvidia l'explorent comme sauvegarde TSMC pour les puces IA

Google a commandé plus de trois millions de puces IA à Intel pour 2028. Nvidia teste la technologie de fabrication d'Intel pour sa prochaine architecture Feynman. Les deux décisions surviennent alors que TSMC ne peut pas répondre à la demande de puces IA. Int…

Infrastructure· MarkTechPost· 9 juin 2026· il y a 2 mois▲

Xiaomi MiMo et TileRT poussent un modèle de 1 000 milliards de paramètres au-delà de 1 000 jetons par seconde sur les GPU de base

L'équipe MiMo de Xiaomi, avec TileRT, a publié MiMo-V2.5-Pro-UltraSpeed, un mode de service pour le modèle MiMo-V2.5-Pro. Il décode plus de 1 000 jetons par seconde sur un modèle de 1 billion de paramètres à l'aide d'un seul nœud de base de 8 GPU.…

Infrastructure· AWS ML· 9 juin 2026· il y a 2 mois■

Libérer la flexibilité de l’IA en Europe : un guide d’inférence interrégionale pour le traitement des données et l’accès aux modèles dans l’UE

Avec l'accès aux derniers modèles d'IA générative et au calcul accéléré hautes performances face à une forte demande mondiale, les clients AWS ont besoin d'outils pour tirer parti de la disponibilité et de la capacité des modèles dans plusieurs régions AWS, avec…

Infrastructure· NVIDIA· 8 juin 2026· il y a 2 mois▲

NVIDIA et LG Group construisent une usine d'IA pour faire progresser l'IA physique, la mobilité et l'infrastructure d'IA

NVIDIA et le groupe LG construisent une usine d'IA pour accélérer la prochaine vague d'activités du groupe LG axées sur l'IA, couvrant la robotique, la conduite autonome, les technologies de centres de données et les services cloud GPU. L’usine IA prouvera…

Infrastructure· The Decoder· 7 juin 2026· il y a 2 mois■

Anthropic débauche le deuxième ingénieur en puces d'OpenAI alors que les deux sociétés se précipitent vers les introductions en bourse

Clive Chan, selon son propre compte, le deuxième employé matériel du programme de puces personnalisées d'OpenAI, déménage chez Anthropic. Il apporte son expérience de l'ASIC Autopilot de Tesla et du partenariat OpenAI-Broadcom. Le déménagement intervient un…

Infrastructure· MarkTechPost· 7 juin 2026· il y a 2 mois▲

La nouvelle CLI Colab de Google permet aux développeurs et aux agents d'IA d'exécuter Python sur des GPU et TPU Colab distants à partir du terminal

Google a publié la CLI Colab, permettant aux développeurs et aux agents d'IA d'exécuter du code local sur le runtime GPU et TPU Colab à distance. L'article La nouvelle CLI Colab de Google permet aux développeurs et aux agents d'IA d'exécuter Python sur des GPU et TPU Colab distants F…

Infrastructure· The Decoder· 6 juin 2026· il y a 2 mois▲

Sakana AI parie qu’une IA qui s’améliore peut briser la course aux armements informatiques des laboratoires frontaliers

Sakana AI a lancé un laboratoire de recherche dédié à l'auto-amélioration récursive : une IA qui s'améliore de manière itérative. La startup japonaise, cofondée par Llion Jones, co-auteur de Transformer, considère RSI comme une alternative au t…

Infrastructure· Ars Technica· 6 juin 2026· il y a 2 mois▼

"Nous avons énervé beaucoup de gens" : le projet d'un centre de données géant réduit de 50 % au milieu des manifestations

Le développeur s'est senti « battu », n'ayant « pas d'autre choix » que de réduire le centre de données.

Infrastructure· MarkTechPost· 5 juin 2026· il y a 2 mois▲

NVIDIA AI lance Nemotron 3 Ultra : un transformateur Mamba hybride ouvert d'un mélange d'experts de 550 B pour les agents de longue durée

NVIDIA a publié Nemotron 3 Ultra, un Mamba-Transformer hybride ouvert et mixte d'experts de 550 B au total (55 B actifs) pour les agents de longue durée. Il associe un contexte de 1 million de jetons à un débit d'inférence jusqu'à environ 6 fois supérieur à celui des concurrents.

Infrastructure· TechCrunch· 5 juin 2026· il y a 2 mois■

Meta vole une tactique à Tesla et construit des centres de données sous des tentes

Meta a peut-être trouvé un moyen de réduire la facture massive de son centre de données : les tentes.

Infrastructure· The Verge· 5 juin 2026· il y a 2 mois▼

Kevin O'Leary accepte de réduire la taille de l'énorme centre de données de l'Utah

Kevin O'Leary a accepté de réduire de moitié la taille de son centre de données prévu de 40 000 acres dans l'Utah, sous la pression croissante des résidents et des militants, comme l'a rapporté plus tôt la filiale locale ABC4. La star de Shark Tank a envoyé une lettre pour…

Infrastructure· TechCrunch· 4 juin 2026· il y a 2 mois▲

La Silicon Valley est-elle prête à installer des robots dans les foyers ? Bonjour Robot.

La startup californienne a lancé la quatrième génération de son robot d'assistance à domicile, Stretch.

Infrastructure· Ars Technica· 4 juin 2026· il y a 2 mois■

Comment certains opérateurs de centres de données résolvent leurs problèmes de consommation d'eau

Les hyperscalers ont été scrutés de près pour leur impact sur la qualité et la disponibilité de l’eau.

Infrastructure· IEEE Spectrum· 4 juin 2026· il y a 2 mois▲

Les avancées classiques nécessaires pour faire fonctionner les ordinateurs quantiques

Les ordinateurs quantiques promettent de résoudre un jour des problèmes dépassant les supercalculateurs les plus puissants imaginables. Mais on sous-estime souvent la quantité d’informatique classique nécessaire au simple fonctionnement de ces machines. Comme le nombre de qubits…

Infrastructure· HotON Desk· 3 juin 2026· il y a 2 mois▼

La capacité régionale des GPU diminue à mesure que de nouveaux clusters sont mis en ligne

De nouvelles capacités de centres de données dans plusieurs régions ont facilité la disponibilité des GPU, contribuant ainsi à faire baisser les indices de coûts d'inférence régionaux cette semaine.

Infrastructure· HotON Desk· 1 juin 2026· il y a 2 mois■

La tarification du calcul liée à l'énergie est déployée dans deux autres régions

De plus en plus de fournisseurs lient les prix de calcul aux conditions énergétiques locales, ajoutant une dimension horaire à l'endroit et au moment où les charges de travail d'IA sont les moins chères.

Infrastructure· NVIDIA· 1 juin 2026· il y a 2 mois▲

L'écosystème NVIDIA AI Cloud s'étend à l'échelle mondiale pour répondre à la demande mondiale en matière de calcul IA

L’écosystème NVIDIA AI Cloud accélère le développement mondial de l’infrastructure des usines d’IA. Les partenaires augmentent leur capacité pour répondre à la demande croissante des entreprises, des startups, des pays, des laboratoires d'IA et des développeurs qui évoluent…

Infrastructure· VentureBeat· 12 janv. 2026· il y a 7 mois▲

Anthropic lance Cowork, un agent Claude Desktop qui fonctionne dans vos fichiers — aucun codage requis

Anthropic a publié lundi Cowork, une nouvelle capacité d'agent d'IA qui étend la puissance de son outil Claude Code à succès aux utilisateurs non techniques - et selon les initiés de l'entreprise, l'équipe a construit l'intégralité de la fonctionnalité…

Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.