Modelleinführungen· The Decoder· 14. Juni 2026· vor 10 Stunden· 1 Min. Lesezeit

AI-Coding-Agenten finden das richtige Datei, aber verpassen die wichtigen Zeilen, zeigt Studie

AI-Coding-Agenten wie Claude Code oder Codex finden das richtige Datei zuverlässig, aber verpassen die meisten kritischen Zeilen darin. Der neue SWE-Explore-Benchmark ist der erste, der Code-Suche getrennt vom tatsächlichen Reparaturprozess testet…

Warum es wichtig ist

Neue Modelle setzen die Leistungs- und Preis-Leistungs-Grenze neu. Die Teams bewerten neu, worauf sie aufbauen können, wenn eine Markteinführung das Mögliche pro Dollar verändert.

Entdecken Sie die Daten dahinter

Verwandte HotON.ai-Seiten

Modelle →Vergleichen →

Original lesen (The Decoder) →

Zusammenfassungen werden nur zu Informationszwecken aggregiert – folgen Sie dem Quelllink für die vollständige Geschichte. Demo-Einträge dienen der Veranschaulichung.

Weitere Neuigkeiten

Infrastrukturvor 5 Stunden

Microsoft Researchs Mirage verleiht der Videogenerierung eine persistente räumliche Erinnerung, die nicht vergisst, was um die Ecke ist

Modelleinführungenvor 5 Stunden

Googles Cloud Open Knowledge Format verwandelt verstreute Dokumente in Markdown-Dateien für AI-Agenten

Modelleinführungenvor 9 Stunden

KPMG fälschte AI-Fallstudien in einem Bericht, der Kunden die AI-Adoption verkaufen soll

Politikvor 10 Stunden

Amazon und fünf andere Unternehmen sollen die Regierungsaktion gegen Anthropic's Fable-Modell ausgelöst haben