Pha trộn $/1 triệu trên các phiên bản được theo dõi của dòng này.
Tỷ lệ kết hợp đầu ra-đầu vào 3:1 điển hình trên mỗi 1M token
Giá tính đến 2026-05-11 · Nguồn: meta_reference_catalog
Khối lượng công việc tạo văn bản, trò chuyện, tóm tắt và nội dung có mục đích chung trong đó khả năng rộng và chi phí thấp là quan trọng nhất.
Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors. This 8B instruct-tuned version is fast and efficient. It has demonstrated strong performance compared to...
llama-3.1-8b-instruct là mẫu Chữ của Meta (US). HotON.ai theo dõi nó ở mức $0.02 trên 1 triệu mã thông báo đầu vào và $0.05 trên 1 triệu mã thông báo đầu ra, với cửa sổ ngữ cảnh mã thông báo 16K. Điểm hiệu quả tổng hợp của nó là 88/100 ở mức $0.000 ước tính cho mỗi nhiệm vụ thành công.
llama-3.1-8b-instruct được theo dõi ở mức $0.02 trên 1 triệu mã thông báo đầu vào và $0.05 trên 1 triệu mã thông báo đầu ra. Khối lượng công việc đầu ra-đầu vào 3:1 điển hình pha trộn với khoảng $0.04 trên mỗi 1 triệu mã thông báo. Số liệu là dữ liệu demo minh họa.
Khối lượng công việc tạo văn bản, trò chuyện, tóm tắt và nội dung có mục đích chung trong đó khả năng rộng và chi phí thấp là quan trọng nhất.
llama-3.1-8b-instruct hỗ trợ tối đa cửa sổ ngữ cảnh mã thông báo 16K - đủ lớn cho các tài liệu dài và các cuộc hội thoại mở rộng trong một yêu cầu.
Trong nhóm theo dõi HotON.ai, llama-3.1-8b-instruct rẻ hơn 97% so với 97% về giá đầu vào và xếp hạng #345 của 521 theo hiệu suất tổng thể.
Có — gemma-3n-e4b-it là một tùy chọn có chi phí thấp hơn ở mức $0.04 trên mỗi 1 triệu mã thông báo đầu ra, trong khi vẫn đáp ứng các trường hợp sử dụng Chữ tương tự. So sánh chúng cạnh nhau trên HotON.ai.
Giá cả là có thật (thông qua danh mục TestKey, được cập nhật hàng ngày). Chất lượng (Arena Elo) là có thật khi mẫu xe được xếp hạng trên LMArena. Tốc độ, tính sẵn có và hiệu quả là những ước tính được mô hình hóa.