Claude Fable 5 di Anthropic raggiunge l'88 percento di accuratezza sul livello più difficile di FrontierMath, un balzo considerevole rispetto a Opus 4.5, che si era fermato al di sotto del 10 percento all'inizio del 2026. GPT-5.5 di OpenAI raggiunge circa il 75 percento sullo stesso livello.
I nuovi modelli ripristinano la frontiera della capacità e del rapporto prezzo-prestazioni. I team rivalutano su cosa costruire ogni volta che un lancio cambia ciò che è possibile fare per ogni dollaro.
Aziende e modelli menzionati in questa storia: apri le loro pagine e scopri i prezzi
I riepiloghi sono aggregati solo a scopo informativo: segui il collegamento alla fonte per la storia completa. Le voci demo sono illustrative.