비공개 가격을 압박하고 액세스 범위를 확대하는 공개 가중치 릴리스 및 커뮤니티 모델.
17 스토리
Open-weights는 폐쇄된 가격 책정에 대한 압박을 풀고 액세스를 확대하여 전체 생태계에 대한 구축-구매 수학 방식을 변경합니다.
Zyphra는 1.2B, 2.7B 및 7B 매개변수의 개방형 비전 언어 모델 제품군인 Zamba2-VL을 출시했습니다. 이 모델은 Apache 2.0에서 제공되는 하이브리드 Mamba2 상태 공간 및 Transformer 백본을 사용합니다. 그들은 경쟁력을 유지합니다…
Cohere의 첫 번째 개발자 코딩 모델은 256K 컨텍스트 길이의 단일 H100에서 실행되는 30B 전문가 혼합입니다. The post 'North Mini Code'를 만나보세요: Cohere의 30B 개방형 전문가 혼합 모델과 3B Active Para…
DiffusionGemma는 GPU에서 최대 4배 빠른 생성을 위해 텍스트 확산을 사용하는 Google DeepMind의 실험적인 26B 개방형 모델입니다. Google AI, 텍스트 확산을 활용한 260억 MoE 개방형 모델인 DiffusionGemma 출시
오늘 Google DeepMind는 매우 빠른 텍스트 생성을 위해 구축된 실험적인 개방형 모델인 DiffusionGemma를 출시했습니다. NVIDIA는 NVIDIA GeForce RTX GPU에서 더욱 빠르게 실행되도록 DiffusionGemma를 최적화했습니다.
에이전트가 포옹하는 두 얼굴 공간을 연결하여 3D 파리 갤러리를 구축한 방법
GitHub CI를 Hugging Face 작업으로 마이그레이션
이 튜토리얼에서는 ClawHub 보안 신호 데이터 세트를 탐색하여 스캐너가 AI 기술을 평가하는 방법을 살펴봅니다. Hugging Face Parquet 변환에서 데이터를 로드하고 판정, 스캐너 출력 및 심각도 레이블을 검사합니다.
이 게시물에서는 두 가지 문제를 해결하기 위해 구축한 오픈 소스 프레임워크인 Nova Sonic Test Harness를 안내합니다. 시스템 프롬프트 및 도구 구성을 조정하기 위한 신속한 반복 도구 역할을 합니다(실행…
오픈 소스 커뮤니티는 Agentic RL용 OpenEnv를 지원합니다.
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
요약은 정보 제공 목적으로만 집계되었습니다. 전체 내용을 보려면 소스 링크를 따르세요. 데모 항목은 예시입니다.