Claude Fable 5 của Anthropic đạt 88% độ chính xác trên cấp độ khó nhất của FrontierMath, một bước nhảy lớn từ Opus 4.5, chỉ đạt dưới 10% vào đầu năm 2026. GPT-5.5 của OpenAI đạt khoảng 75% trên cùng cấp độ.
Các mô hình mới thiết lập lại giới hạn về năng lực và hiệu suất giá cả. Các nhóm đánh giá lại những gì cần xây dựng bất cứ khi nào đợt ra mắt thay đổi số tiền có thể có trên mỗi đô la.
Các công ty và mô hình được đề cập trong câu chuyện này — hãy mở trang của họ và xem giá trực tiếp
Các bản tóm tắt chỉ được tổng hợp để cung cấp thông tin - hãy nhấp vào liên kết nguồn để xem toàn bộ câu chuyện. Các mục demo có tính minh họa.