Lanci di modelli· The Decoder· 14 giu 2026· ieri· 1 lettura minima

Agenti di codifica AI trovano il file giusto ma non le linee esatte che contano, dimostra uno studio

Agenti di codifica AI come Claude Code o Codex trovano il file giusto ma non la maggior parte delle linee critiche al suo interno. Il nuovo benchmark SWE-Explore è il primo a testare la ricerca del codice separatamente dalla riparazione effettiva, un…

Perché è importante

I nuovi modelli ripristinano la frontiera della capacità e del rapporto prezzo-prestazioni. I team rivalutano su cosa costruire ogni volta che un lancio cambia ciò che è possibile fare per ogni dollaro.

Esplora i dati dietro questo

Pagine HotON.ai correlate

Modelli →Confrontare →

Leggi l'originale (The Decoder) →

I riepiloghi sono aggregati solo a scopo informativo: segui il collegamento alla fonte per la storia completa. Le voci demo sono illustrative.

Altre notizie

Lanci di modelli1 ora fa

Il CEO di Microsoft Satya Nadella avverte di "un piccolo numero di sistemi AI che catturano tutti i rendimenti economici"

Open Source2 ore fa

Incontri Flash-KMeans: Un K-Means Esatto IO-Aware che Funziona 200× Più Velocemente di FAISS sui GPU

Lanci di modelli2 ore fa

Meta ha utilizzato un fornitore del Pentagono per prototipare la riconoscimento facciale per i suoi occhiali

Lanci di modelli4 ore fa

L'onda di licenziamenti AI sta diventando una bomba a dischi