LifeSciBench của OpenAI đánh giá liệu AI tiên tiến có thể xử lý nghiên cứu khoa học thực tế trên 750 nhiệm vụ được viết bởi chuyên gia, bảy quy trình và bảy lĩnh vực sinh học. Được xây dựng bởi 173 nhà khoa học có bằng tiến sĩ với 19.020 quy tắc đánh giá...
Các mô hình mới thiết lập lại giới hạn về năng lực và hiệu suất giá cả. Các nhóm đánh giá lại những gì cần xây dựng bất cứ khi nào đợt ra mắt thay đổi số tiền có thể có trên mỗi đô la.
Các bản tóm tắt chỉ được tổng hợp để cung cấp thông tin - hãy nhấp vào liên kết nguồn để xem toàn bộ câu chuyện. Các mục demo có tính minh họa.