Ra mắt mẫu· The Decoder· 13 thg 6, 2026· 6 ngày trước· 1 phút đọc

Claude Fable 5 vượt qua GPT-5.5 13 điểm trên các vấn đề khó nhất của FrontierMath

Claude Fable 5 của Anthropic đạt 88% độ chính xác trên cấp độ khó nhất của FrontierMath, một bước nhảy lớn từ Opus 4.5, chỉ đạt dưới 10% vào đầu năm 2026. GPT-5.5 của OpenAI đạt khoảng 75% trên cùng cấp độ.

Tại sao nó quan trọng

Các mô hình mới thiết lập lại giới hạn về năng lực và hiệu suất giá cả. Các nhóm đánh giá lại những gì cần xây dựng bất cứ khi nào đợt ra mắt thay đổi số tiền có thể có trên mỗi đô la.