ओपन-वेट रिलीज़ और सामुदायिक मॉडल बंद मूल्य निर्धारण और व्यापक पहुंच पर दबाव डाल रहे हैं।
17 कहानियाँ
ओपन-वेट दबाव बंद मूल्य निर्धारण और पहुंच को व्यापक बनाता है, जिससे पूरे पारिस्थितिकी तंत्र के लिए बिल्ड-बनाम-खरीद गणित बदल जाता है।
Zyphra ने 1.2B, 2.7B और 7B मापदंडों पर ओपन विज़न-लैंग्वेज मॉडल का एक परिवार, Zamba2-VL जारी किया है। मॉडल हाइब्रिड Mamba2 स्टेट-स्पेस और ट्रांसफॉर्मर बैकबोन का उपयोग करते हैं, जो Apache 2.0 के तहत शिपिंग है। वे प्रतिस्पर्धी बने रहते हैं...
कोहेयर का पहला डेवलपर कोडिंग मॉडल एक 30B मिश्रण-विशेषज्ञ है जो 256K संदर्भ लंबाई के साथ एकल H100 पर चलता है। पोस्ट 'नॉर्थ मिनी कोड' से मिलें: 3बी एक्टिव पैरा के साथ कोहेयर का 30बी ओपन-वेट मिक्सचर-ऑफ-एक्सपर्ट्स मॉडल...
डिफ्यूजनजेम्मा Google DeepMind का प्रयोगात्मक 26B ओपन मॉडल है जो GPU पर 4x तेज पीढ़ी के लिए टेक्स्ट डिफ्यूजन का उपयोग करता है। पोस्ट Google AI ने अप टू डेट के लिए टेक्स्ट डिफ्यूजन का उपयोग करने वाला 26B MoE ओपन मॉडल डिफ्यूजनजेम्मा जारी किया...
आज, Google DeepMind ने डिफ्यूज़नजेम्मा जारी किया - असाधारण तेज़ टेक्स्ट जेनरेशन के लिए बनाया गया एक प्रायोगिक खुला मॉडल। NVIDIA ने NVIDIA GeForce RTX GPU पर और भी तेजी से चलने के लिए डिफ्यूजनजेम्मा को अनुकूलित किया है, NVIDIA…
कैसे एक एजेंट ने दो आलिंगनशील फेस स्पेस को जंजीर से जोड़कर एक 3डी पेरिस गैलरी का निर्माण किया
अपने GitHub CI को हगिंग फेस जॉब्स में स्थानांतरित करना
इस ट्यूटोरियल में, हम यह देखने के लिए क्लॉहब सुरक्षा सिग्नल डेटासेट का पता लगाते हैं कि स्कैनर एआई कौशल का आकलन कैसे करते हैं। हम हगिंग फेस परक्वेट रूपांतरण से डेटा लोड करते हैं और फैसले, स्कैनर आउटपुट और गंभीरता लेबल का निरीक्षण करते हैं...
इस पोस्ट में, हम आपको नोवा सोनिक टेस्ट हार्नेस के बारे में बताते हैं, जो एक ओपन सोर्स फ्रेमवर्क है जिसे हमने दोनों समस्याओं को हल करने के लिए बनाया है। यह सिस्टम प्रॉम्प्ट और टूल कॉन्फ़िगरेशन को ट्यून करने के लिए एक तीव्र पुनरावृत्ति उपकरण के रूप में कार्य करता है (एक चलाएँ…
ओपन सोर्स समुदाय एजेंटिक आरएल के लिए ओपनएनवी का समर्थन कर रहा है
Unlike GPT-4o or Qwen3.5-Omni, Audio Interaction doesn't wait for a recording to end: it translates, transcribes, chats, and picks up everyday noises like coughing in a single stream. Code, model weights, and download i…
Kimi Code CLI is Moonshot AI's open-source terminal coding agent, written in TypeScript with subagents and MCP configuration. The post Moonshot AI Releases Kimi Code CLI: A Terminal AI Coding Agent Built in TypeScript f…
Miso Labs has released MisoTTS, an open-weights 8B text-to-speech model. It uses residual vector quantization (RVQ) to scale its sonic range without scaling parameters, and conditions on both text and audio context to r…
Stanford researchers released OpenJarvis, an open-source framework that runs inference, agents, memory, and learning entirely on-device. It decomposes a personal AI system into five composable primitives — Intelligence,…
Google Deepmind's Gemma 4 12B is an open-source model that processes text, images, and audio natively and runs on laptops with just 16 GB of RAM. It nearly matches the twice-as-large 26B model in benchmarks and ships un…
Gemma 4 12B feeds vision and audio straight into the LLM backbone, running locally under an Apache 2.0 license. The post Google DeepMind Releases Gemma 4 12B: An Encoder-Free Multimodal Model with Native audio that runs…
A new open-weights release reports parity with leading closed models on several reasoning benchmarks, strengthening the open ecosystem's momentum.
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary sy…
सारांश केवल जानकारी के लिए एकत्र किए गए हैं - पूरी कहानी के लिए स्रोत लिंक का अनुसरण करें। डेमो प्रविष्टियाँ उदाहरणात्मक हैं।