Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-05-11 · Sumber: nvidia_reference_catalog
Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.
NVIDIA Nemotron 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications. Built on a hybrid Mamba-Transformer...
nemotron-3-super-120b-a12b adalah model Teks dari NVIDIA (US). HotON.ai melacaknya pada $0.10 per 1 juta token masukan dan $0.50 per 1 juta token keluaran, dengan jendela konteks token 262K. Skor efisiensi gabungannya adalah 90/100 dengan perkiraan $0.000 per tugas yang berhasil.
nemotron-3-super-120b-a12b dilacak pada $0.10 per 1 juta token masukan dan $0.50 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.40 per 1 juta token. Angka adalah ilustrasi data demo.
Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.
nemotron-3-super-120b-a12b mendukung hingga jendela konteks token 262K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, nemotron-3-super-120b-a12b lebih murah dibandingkan 78% model dalam hal harga input dan menempati peringkat #73 dari 521 berdasarkan efisiensi keseluruhan.
Ya — deepseek/deepseek-v4-flash adalah opsi berbiaya lebih rendah di $0.28 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Teks yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.