Запуск моделей· The Decoder· 14 июн. 2026 г.· вчера· 1 минута чтения

AI-агенты кодирования находят правильный файл, но пропускают важные строки, показывают исследования

AI-агенты кодирования, такие как Claude Code или Codex, надежно находят правильный файл, но пропускают большинство критических строк в нем. Новый бенчмарк SWE-Explore первый, кто тестирует поиск кода отдельно от фактического ремонта...

Почему это важно

Новые модели сбрасывают границы возможностей и цены-качества. Команды пересматривают, на чем основываться, всякий раз, когда запуск меняет возможный размер за доллар.

Изучите данные, стоящие за этим

Связанные страницы HotON.ai

Модели →Сравнивать →

Читать оригинал (The Decoder) →

Краткое изложение собрано только для информации — перейдите по ссылке на источник, чтобы получить полную информацию. Демонстрационные записи носят иллюстративный характер.

Больше новостей

Запуск моделей4 часа назад

Z.ai запустил GLM-5.2 с использованием контекста из 1 миллиона токенов, двумя уровнями усилий и без эталонов на старте