オープンウェイトのリリースとコミュニティ モデルにより、クローズド価格設定とアクセスの拡大が圧力をかけられます。
17 のストーリー
オープンウェイトのリリースはクローズド価格に圧力をかけ、アクセスを拡大し、エコシステム全体の構築と購入の計算を変えます。
Zyphra は、パラメータ 1.2B、2.7B、および 7B のオープン ビジョン言語モデル ファミリである Zamba2-VL をリリースしました。このモデルは、ハイブリッド Mamba2 状態空間と Transformer バックボーンを使用し、Apache 2.0 で出荷されます。彼らは競争力を維持します…
Cohere の最初の開発者コーディング モデルは、コンテキスト長 256K の単一の H100 上で実行される 30B の専門家の混合モデルです。 The post 「North Mini Code」の紹介: 3B アクティブパラメタを備えた Cohere の 30B オープンウェイト専門家混合モデル
DiffusionGemma は、GPU 上で最大 4 倍高速に生成するテキスト拡散を使用する、Google DeepMind の実験的な 26B オープン モデルです。 The post Google AI がテキスト拡散を使用した 26B MoE オープン モデルである DiffusionGemma をリリース…
本日、Google DeepMind は、非常に高速なテキスト生成のために構築された実験的なオープン モデルである DifffusionGemma をリリースしました。 NVIDIA は、NVIDIA GeForce RTX GPU、NVIDIA 上でさらに高速に実行できるように DiffusionGemma を最適化しました。
エージェントが 2 つのハグ顔スペースを連鎖させて 3D パリ ギャラリーを構築した方法
GitHub CI を Hugging Face ジョブに移行する
このチュートリアルでは、ClawHub Security Signals データセットを調べて、スキャナーが AI スキルをどのように評価するかを確認します。 Hugging Face Parquet 変換からデータをロードし、判定、スキャナー出力、重大度ラベルを検査します。
この投稿では、両方の問題を解決するために私たちが構築したオープンソース フレームワークである Nova Sonic Test Harness について説明します。これは、システム プロンプトとツール構成を調整するための迅速な反復ツールとして機能します (実行...
オープンソース コミュニティは、Agentic RL の OpenEnv を支援しています
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
概要は情報提供のみを目的としてまとめられています。全文についてはソース リンクを参照してください。デモのエントリは一例です。