Lancements de modèles· The Decoder· 14 juin 2026· hier· Lecture minimale de 1

Les agents de codage IA trouvent le bon fichier mais ratent les lignes exactes qui comptent, selon une étude

Les agents de codage IA tels que Claude Code ou Codex trouvent le bon fichier en toute confiance mais ratent la plupart des lignes critiques à l'intérieur. Le nouveau benchmark SWE-Explore est le premier à tester la recherche de code séparément de la réparation réelle...

Pourquoi c'est important

Les nouveaux modèles repoussent les limites des capacités et du rapport qualité-prix. Les équipes réévaluent les éléments sur lesquels s'appuyer chaque fois qu'un lancement modifie ce qui est possible par dollar.

Explorez les données derrière cela

Pages HotON.ai associées

Modèles →Comparer →

Lire l'original (The Decoder) →

Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.

Plus de nouvelles

Lancements de modèlesil y a 3 heures

Z.ai lance GLM-5.2 avec un contexte utilisable de 1 million de tokens, deux niveaux d'effort de pensée et sans benchmarks au lancement

Lancements de modèlesil y a 7 heures

Citation de Julia Evans

Lancements de modèlesil y a 8 heures

Guide Claude Code 2026 : 25 fonctionnalités avec exemples + démonstration

Lancements de modèlesil y a 9 heures

Pourquoi l'IA n'a pas remplacé les ingénieurs en logiciel et ne le fera pas