Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-05-11 · Sumber: ibm_granite_reference_catalog
Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.
Granite-4.0-H-Micro adalah parameter 3B dari rangkaian model Granite 4. Model-model ini merupakan yang terbaru dari serangkaian model yang dirilis oleh IBM. Mereka disetel dengan baik untuk waktu yang lama...
granite-4.0-h-micro adalah model Teks dari Ibm Granite (US). HotON.ai melacaknya pada $0.02 per 1 juta token masukan dan $0.11 per 1 juta token keluaran, dengan jendela konteks token 131K. Skor efisiensi gabungannya adalah 89/100 dengan perkiraan $0.000 per tugas yang berhasil.
granite-4.0-h-micro dilacak pada $0.02 per 1 juta token masukan dan $0.11 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.09 per 1 juta token. Angka adalah ilustrasi data demo.
Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.
granite-4.0-h-micro mendukung hingga jendela konteks token 131K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, granite-4.0-h-micro lebih murah dibandingkan 97% model dalam hal harga input dan menempati peringkat #265 dari 522 berdasarkan efisiensi keseluruhan.
Ya — Llama-3.2-3B-Instruct adalah opsi berbiaya lebih rendah di $0.02 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Teks yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Siap untuk ditempelkan ke dalam artikel, makalah, atau permintaan AI — harga dan tanggal diperbarui dengan data langsung.
HotON.ai — granite-4.0-h-micro (Ibm Granite): $0.02/1M input, $0.11/1M output, as of 2026-05-11. https://hoton.ai/id/models/ibm-granite-granite-4-0-h-microHarga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.