VibeThinker-3B, un modello di ragionamento da 3B licenziato da MIT che corrisponde a DeepSeek V3.2 e Kimi K2.5 sui benchmark verificabili. Dopo VibeThinker-3B: Un modello di ragionamento denso da 3B costruito su Qwen2.5-Coder-3B con il pipeline di post-addestramento da spettro a segnale…
I nuovi modelli ripristinano la frontiera della capacità e del rapporto prezzo-prestazioni. I team rivalutano su cosa costruire ogni volta che un lancio cambia ciò che è possibile fare per ogni dollaro.
Aziende e modelli menzionati in questa storia: apri le loro pagine e scopri i prezzi
I riepiloghi sono aggregati solo a scopo informativo: segui il collegamento alla fonte per la storia completa. Le voci demo sono illustrative.