Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-05-10 · Sumber: cerebras_official_pricing
Penalaran, analisis, perencanaan, dan pemecahan masalah multi-langkah yang kompleks di mana kualitas jawaban lebih penting daripada biaya mentah.
DeepSeek R1 Distill Llama 70B on Cerebras is a fast reasoning model for analytical tasks.
deepseek-r1-distill-llama-70b adalah model Pemikiran dari Cerebras (US). HotON.ai melacaknya pada $2.20 per 1 juta token masukan dan $2.50 per 1 juta token keluaran, dengan jendela konteks token 8K. Skor efisiensi gabungannya adalah 87/100 dengan perkiraan $0.006 per tugas yang berhasil.
deepseek-r1-distill-llama-70b dilacak pada $2.20 per 1 juta token masukan dan $2.50 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $2.42 per 1 juta token. Angka adalah ilustrasi data demo.
Penalaran, analisis, perencanaan, dan pemecahan masalah multi-langkah yang kompleks di mana kualitas jawaban lebih penting daripada biaya mentah.
deepseek-r1-distill-llama-70b mendukung hingga jendela konteks token 8K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, deepseek-r1-distill-llama-70b lebih murah dibandingkan 14% model dalam hal harga input dan menempati peringkat #419 dari 521 berdasarkan efisiensi keseluruhan.
Ya — qwen-plus-2025-07-28:thinking adalah opsi berbiaya lebih rendah di $0.78 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Pemikiran yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.