Giá hỗn hợp hàng ngày ($/1 triệu) — được ghi lại mỗi ngày, hình thành xu hướng theo thời gian.
Tỷ lệ kết hợp đầu ra-đầu vào 3:1 điển hình trên mỗi 1M token
Giá tính đến 2026-05-10 · Nguồn: cerebras_official_pricing
Lý luận, phân tích, lập kế hoạch và giải quyết vấn đề phức tạp gồm nhiều bước trong đó chất lượng câu trả lời quan trọng hơn chi phí thô.
DeepSeek R1 Distill Llama 70B on Cerebras is a fast reasoning model for analytical tasks.
deepseek-r1-distill-llama-70b là mẫu Lý luận của Cerebras (US). HotON.ai theo dõi nó ở mức $2.20 trên 1 triệu mã thông báo đầu vào và $2.50 trên 1 triệu mã thông báo đầu ra, với cửa sổ ngữ cảnh mã thông báo 8K. Điểm hiệu quả tổng hợp của nó là 87/100 ở mức $0.006 ước tính cho mỗi nhiệm vụ thành công.
deepseek-r1-distill-llama-70b được theo dõi ở mức $2.20 trên 1 triệu mã thông báo đầu vào và $2.50 trên 1 triệu mã thông báo đầu ra. Khối lượng công việc đầu ra-đầu vào 3:1 điển hình pha trộn với khoảng $2.42 trên mỗi 1 triệu mã thông báo. Số liệu là dữ liệu demo minh họa.
Lý luận, phân tích, lập kế hoạch và giải quyết vấn đề phức tạp gồm nhiều bước trong đó chất lượng câu trả lời quan trọng hơn chi phí thô.
deepseek-r1-distill-llama-70b hỗ trợ tối đa cửa sổ ngữ cảnh mã thông báo 8K - đủ lớn cho các tài liệu dài và các cuộc hội thoại mở rộng trong một yêu cầu.
Trong nhóm theo dõi HotON.ai, deepseek-r1-distill-llama-70b rẻ hơn 14% so với 14% về giá đầu vào và xếp hạng #419 của 521 theo hiệu suất tổng thể.
Có — qwen-plus-2025-07-28:thinking là một tùy chọn có chi phí thấp hơn ở mức $0.78 trên mỗi 1 triệu mã thông báo đầu ra, trong khi vẫn đáp ứng các trường hợp sử dụng Lý luận tương tự. So sánh chúng cạnh nhau trên HotON.ai.
Giá cả là có thật (thông qua danh mục TestKey, được cập nhật hàng ngày). Chất lượng (Arena Elo) là có thật khi mẫu xe được xếp hạng trên LMArena. Tốc độ, tính sẵn có và hiệu quả là những ước tính được mô hình hóa.