Lançamentos de peso aberto e modelos comunitários pressionando preços fechados e ampliando o acesso.
Histórias 17
Os lançamentos de pesos abertos pressionam os preços fechados e ampliam o acesso, mudando a matemática construção versus compra para todo o ecossistema.
A Zyphra lançou o Zamba2-VL, uma família de modelos de linguagem de visão aberta com parâmetros de 1,2B, 2,7B e 7B. Os modelos usam um espaço de estado Mamba2 híbrido e um backbone Transformer, fornecido no Apache 2.0. Eles permanecem competitivos ...
O primeiro modelo de codificação de desenvolvedor de Cohere é uma mistura de especialistas de 30B rodando em um único H100 com comprimento de contexto de 256K. A postagem Conheça o 'North Mini Code': modelo de mistura de especialistas de peso aberto 30B de Cohere com 3B Active Para…
DiffusionGemma é o modelo aberto experimental de 26B do Google DeepMind que usa difusão de texto para geração até 4x mais rápida em GPUs. A postagem Google AI lança DiffusionGemma, um modelo aberto 26B MoE usando difusão de texto para up t…
Hoje, o Google DeepMind lançou o DiffusionGemma — um modelo experimental aberto construído para geração de texto excepcionalmente rápida. A NVIDIA otimizou o DiffusionGemma para rodar ainda mais rápido nas GPUs NVIDIA GeForce RTX, a NVIDIA…
Como um agente construiu uma galeria 3D em Paris encadeando dois espaços faciais abraçados
Migrando seu GitHub CI para trabalhos Hugging Face
Neste tutorial, exploramos o conjunto de dados ClawHub Security Signals para ver como os scanners avaliam as habilidades de IA. Carregamos os dados da conversão Hugging Face Parquet e inspecionamos veredictos, resultados do scanner e rótulo de gravidade…
Neste post, mostramos o Nova Sonic Test Harness, uma estrutura de código aberto que construímos para resolver ambos os problemas. Ele serve como uma ferramenta de iteração rápida para ajustar prompts do sistema e configurações de ferramentas (execute um…
A comunidade de código aberto está apoiando OpenEnv para Agentic RL
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
Os resumos são agregados apenas para fins informativos – siga o link da fonte para ver a história completa. As entradas de demonstração são ilustrativas.