Les versions à pondération ouverte et les modèles communautaires font pression sur les prix fermés et élargissent l'accès.
Histoires 17
Les pondérations ouvertes relâchent la pression sur les prix fermés et élargissent l'accès, modifiant ainsi le calcul de la construction par rapport à l'achat pour l'ensemble de l'écosystème.
Zyphra a publié Zamba2-VL, une famille de modèles en langage de vision ouvert aux paramètres 1,2B, 2,7B et 7B. Les modèles utilisent un espace d'état hybride Mamba2 et un backbone Transformer, livrés sous Apache 2.0. Ils restent compétitifs…
Le premier modèle de codage pour développeurs de Cohere est un mélange de 30 milliards d'experts fonctionnant sur un seul H100 avec une longueur de contexte de 256 Ko. L'article Rencontrez « North Mini Code » : le modèle de mélange d'experts à poids ouvert 30B de Cohere avec 3B Active Para…
DiffusionGemma est le modèle ouvert expérimental 26B de Google DeepMind utilisant la diffusion de texte pour une génération jusqu'à 4 fois plus rapide sur les GPU. L'article Google AI lance DiffusionGemma, un modèle ouvert MoE de 26 milliards utilisant la diffusion de texte pour jusqu'à t…
Aujourd'hui, Google DeepMind a publié DiffusionGemma, un modèle ouvert expérimental conçu pour une génération de texte exceptionnellement rapide. NVIDIA a optimisé DiffusionGemma pour fonctionner encore plus rapidement sur les GPU NVIDIA GeForce RTX, le NVIDIA…
Comment un agent a construit une galerie parisienne en 3D en enchaînant deux espaces de visage enlacés
Migration de votre GitHub CI vers Hugging Face Jobs
Dans ce didacticiel, nous explorons l'ensemble de données ClawHub Security Signals pour voir comment les scanners évaluent les compétences en IA. Nous chargeons les données de la conversion Hugging Face Parquet et inspectons les verdicts, les sorties du scanner et l'étiquette de gravité…
Dans cet article, nous vous présentons Nova Sonic Test Harness, un framework open source que nous avons construit pour résoudre les deux problèmes. Il sert d'outil d'itération rapide pour régler les invites du système et les configurations d'outils (exécuter un…
La communauté Open Source soutient OpenEnv pour Agentic RL
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.