Open-Weight-Releases und Community-Modelle setzen geschlossene Preise unter Druck und erweitern den Zugang.
17-Geschichten
Open-Weights verringern den Preisdruck und erweitern den Zugang, wodurch sich die Build-vs-Buy-Mathematik für das gesamte Ökosystem ändert.
Zyphra hat Zamba2-VL veröffentlicht, eine Familie offener Vision-Sprachmodelle mit den Parametern 1,2B, 2,7B und 7B. Die Modelle nutzen einen hybriden Mamba2-Zustandsraum und ein Transformer-Backbone und werden unter Apache 2.0 ausgeliefert. Sie bleiben konkurrenzfähig ...
Das erste Entwickler-Codierungsmodell von Cohere ist eine 30-B-Expertenmischung, die auf einem einzigen H100 mit 256-KB-Kontextlänge ausgeführt wird. Der Beitrag Lernen Sie „North Mini Code“ kennen: Coheres 30B Open-Weight Mixture-of-Experts-Modell mit 3B Active Para…
DiffusionGemma ist das experimentelle offene 26B-Modell von Google DeepMind, das Textdiffusion für eine bis zu viermal schnellere Generierung auf GPUs nutzt. Der Beitrag Google AI veröffentlicht DiffusionGemma, ein offenes 26B-MoE-Modell, das Textdiffusion für bis zu … verwendet.
Heute hat Google DeepMind DiffusionGemma veröffentlicht – ein experimentelles offenes Modell, das für eine außergewöhnlich schnelle Textgenerierung entwickelt wurde. NVIDIA hat DiffusionGemma optimiert, um auf allen NVIDIA GeForce RTX-GPUs noch schneller zu laufen, dem NVIDIA…
Wie ein Agent eine 3D-Paris-Galerie baute, indem er zwei sich umarmende Gesichtsbereiche aneinanderreihte
Migrieren Sie Ihr GitHub-CI zu Hugging Face Jobs
In diesem Tutorial untersuchen wir den ClawHub Security Signals-Datensatz, um zu sehen, wie Scanner KI-Fähigkeiten bewerten. Wir laden die Daten aus der Hugging Face Parquet-Konvertierung und überprüfen Urteile, Scannerausgaben und Schweregradbezeichnungen …
In diesem Beitrag führen wir Sie durch das Nova Sonic Test Harness, ein Open-Source-Framework, das wir zur Lösung beider Probleme entwickelt haben. Es dient als schnelles Iterationstool zum Optimieren von Systemeingabeaufforderungen und Toolkonfigurationen (Ausführen eines…
Die Open-Source-Community unterstützt OpenEnv für Agentic RL
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
Zusammenfassungen werden nur zu Informationszwecken aggregiert – folgen Sie dem Quelllink für die vollständige Geschichte. Demo-Einträge dienen der Veranschaulichung.