Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-05-11 · Sumber: meta_reference_catalog
Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.
Llama Guard 4 is a Llama 4 Scout-derived multimodal pretrained model, fine-tuned for content safety classification. Similar to previous versions, it can be used to classify content in both LLM...
llama-guard-4-12b adalah model Multimoda dari Meta (US). HotON.ai melacaknya pada $0.18 per 1 juta token masukan dan $0.18 per 1 juta token keluaran, dengan jendela konteks token 164K. Skor efisiensi gabungannya adalah 90/100 dengan perkiraan $0.000 per tugas yang berhasil.
llama-guard-4-12b dilacak pada $0.18 per 1 juta token masukan dan $0.18 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.18 per 1 juta token. Angka adalah ilustrasi data demo.
Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.
llama-guard-4-12b mendukung hingga jendela konteks token 164K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, llama-guard-4-12b lebih murah dibandingkan 68% model dalam hal harga input dan menempati peringkat #67 dari 521 berdasarkan efisiensi keseluruhan.
Ya — qwen3.5-flash-02-23 adalah opsi berbiaya lebih rendah di $0.26 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Multimoda yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.