Lanzamientos de peso abierto y modelos comunitarios que presionan precios cerrados y amplían el acceso.
historias 17
Las liberaciones de pesos abiertos presionan los precios cerrados y amplían el acceso, cambiando la matemática de construcción versus compra para todo el ecosistema.
Zyphra ha lanzado Zamba2-VL, una familia de modelos de lenguaje de visión abierto con parámetros 1.2B, 2.7B y 7B. Los modelos utilizan un espacio de estado híbrido Mamba2 y una columna vertebral Transformer, que se envía bajo Apache 2.0. Se mantienen competitivos...
El primer modelo de codificación para desarrolladores de Cohere es una combinación de 30B de expertos que se ejecuta en un único H100 con una longitud de contexto de 256K. La publicación Conozca el 'North Mini Code': el modelo de mezcla de expertos de peso abierto 30B de Cohere con 3B Active Para...
DiffusionGemma es el modelo abierto experimental de 26B de Google DeepMind que utiliza difusión de texto para una generación hasta 4 veces más rápida en GPU. La publicación Google AI lanza DiffusionGemma, un modelo abierto de 26 mil millones de MoE que utiliza difusión de texto para hasta t...
Hoy, Google DeepMind lanzó DiffusionGemma, un modelo abierto experimental creado para una generación de texto excepcionalmente rápida. NVIDIA ha optimizado DiffusionGemma para ejecutarse aún más rápido en las GPU NVIDIA GeForce RTX, NVIDIA...
Cómo un agente construyó una galería de París en 3D encadenando dos espacios faciales abrazados
Migrando su GitHub CI a Hugging Face Jobs
En este tutorial, exploramos el conjunto de datos de ClawHub Security Signals para ver cómo los escáneres evalúan las habilidades de IA. Cargamos los datos de la conversión de Hugging Face Parquet e inspeccionamos los veredictos, los resultados del escáner y la etiqueta de gravedad...
En esta publicación, lo guiaremos a través de Nova Sonic Test Harness, un marco de código abierto que creamos para resolver ambos problemas. Sirve como una herramienta de iteración rápida para ajustar las indicaciones del sistema y las configuraciones de herramientas (ejecute un...
La comunidad de código abierto respalda OpenEnv para Agentic RL
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
Los resúmenes se agregan únicamente con fines informativos; siga el enlace fuente para ver la historia completa. Las entradas de demostración son ilustrativas.