USTeksNVIDIA Langsung · diperbarui setiap hari

nvidia/Nemotron-120B-A12B

Baseten Model APIs

Skor efisiensi

90/100

Harga masukan

$0.30/ 1 juta token

Harga keluaran

$0.75/ 1 juta token

Jendela konteks

202K

Harga campuran

$0.64/ 1 juta token

Biaya / tugas

$0.001

Peringatan penurunan harga

Dapatkan email saat harga campuran model ini turun. Tidak diperlukan akun.

Satu email per tetes. Berhenti berlangganan kapan saja.

Kemampuan

Menerima (masukan)

Teks

Menghasilkan (keluaran)

Teks

Harga seiring berjalannya waktu

Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.

Rincian harga

Harga masukan

$0.30/ 1 juta token

$0.0003 / 1K

Harga keluaran

$0.75/ 1 juta token

$0.0008 / 1K

Harga campuran

$0.64/ 1 juta token

$0.0006 / 1K

Campuran output-to-input 3:1, per 1 juta token

Harga pada 2026-05-11 · Sumber: baseten_reference_catalog

Perkiraan biaya bulanan berdasarkan beban kerja

Asisten obrolan

$180.00/ bln

1 ribu masuk · 400 keluar · 10 ribu permintaan/hari

RAG / konteks panjang

$427.50/ bln

8 ribu masuk · 600 keluar · 5 ribu permintaan/hari

Penggunaan agen/alat

$486.00/ bln

3K masuk · 1,5K keluar · 8K permintaan/hari

Perkirakan biaya Anda →

Posisi pasar

Lebih murah daripada 51% model terlacak
Konteks lebih besar dibandingkan 67% model yang dilacak
Peringkat efisiensi: #95 dari 535

Paling cocok untuk

Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.

Tentang nvidia/Nemotron-120B-A12B

Rute Baseten Model API untuk Nemotron Super, menambahkan baris alasan NVIDIA konteks panjang dengan bidang harga Model API terkelola.

nvidia/Nemotron-120B-A12B adalah model Teks dari Baseten Model APIs (US). HotON.ai melacaknya pada $0.30 per 1 juta token masukan dan $0.75 per 1 juta token keluaran, dengan jendela konteks token 202K. Skor efisiensi gabungannya adalah 90/100 dengan perkiraan $0.001 per tugas yang berhasil.

Bandingkan nvidia/Nemotron-120B-A12B

NVIDIA vs QWEN3.6-FLASH NVIDIA vs ACCOUNTS NVIDIA vs SEED-2.0-MINI NVIDIA vs LING-2.6-FLASH

Berita pasar terkait

Kelompok agen Cursor menyarankan model yang lebih murah dapat menangani sebagian besar pengkodean ketika model frontier merencanakan pekerjaannya3 jam yang lalu Kekuatan Super AI Baru: Fokus dan Tindak Lanjut5 jam yang lalu Teknologi Optik Akan Memperbarui AI Robot dengan Cepat5 jam yang lalu

Pertanyaan yang sering diajukan

Berapa biaya nvidia/Nemotron-120B-A12B per 1 juta token?+

nvidia/Nemotron-120B-A12B dilacak pada $0.30 per 1 juta token masukan dan $0.75 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.64 per 1 juta token. Angka adalah ilustrasi data demo.

Untuk apa nvidia/Nemotron-120B-A12B terbaik?+

Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.

Seberapa besar jendela konteks nvidia/Nemotron-120B-A12B?+

nvidia/Nemotron-120B-A12B mendukung hingga jendela konteks token 202K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.

Apakah nvidia/Nemotron-120B-A12B lebih murah dibandingkan model AI lainnya?+

Dalam rangkaian terlacak HotON.ai, nvidia/Nemotron-120B-A12B lebih murah dibandingkan 51% model dalam hal harga input dan menempati peringkat #95 dari 535 berdasarkan efisiensi keseluruhan.

Apakah ada alternatif yang lebih murah selain nvidia/Nemotron-120B-A12B?+

Ya — deepseek-v4-flash adalah opsi berbiaya lebih rendah di $0.28 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Teks yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.

Kutip model ini

Siap untuk ditempelkan ke dalam artikel, makalah, atau permintaan AI — harga dan tanggal diperbarui dengan data langsung.

HotON.ai — nvidia/Nemotron-120B-A12B (Baseten Model APIs): $0.30/1M input, $0.75/1M output, as of 2026-05-11. https://hoton.ai/id/models/baseten-nvidia-nemotron-120b-a12b

Model terkait

qwen3.6-flash

Qwen

$1.13

accounts/fireworks/models/minimax-m2p5

Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Efisiensi adalah gabungan harga riil dan konteks yang dimodelkan.

Harga seiring berjalannya waktu

Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.

Rincian harga

Harga masukan

$0.30/ 1 juta token

$0.0003 / 1K

Harga keluaran

$0.75/ 1 juta token

$0.0008 / 1K

Harga campuran

$0.64/ 1 juta token

$0.0006 / 1K

Campuran output-to-input 3:1, per 1 juta token

Perkiraan biaya bulanan berdasarkan beban kerja

Asisten obrolan

$180.00/ bln

1 ribu masuk · 400 keluar · 10 ribu permintaan/hari

RAG / konteks panjang

$427.50/ bln

8 ribu masuk · 600 keluar · 5 ribu permintaan/hari

Penggunaan agen/alat

$486.00/ bln

3K masuk · 1,5K keluar · 8K permintaan/hari

Perkirakan biaya Anda →

Paling cocok untuk

Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.

Tentang nvidia/Nemotron-120B-A12B

Rute Baseten Model API untuk Nemotron Super, menambahkan baris alasan NVIDIA konteks panjang dengan bidang harga Model API terkelola.

Pertanyaan yang sering diajukan

Berapa biaya nvidia/Nemotron-120B-A12B per 1 juta token?+

Untuk apa nvidia/Nemotron-120B-A12B terbaik?+

Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.

Seberapa besar jendela konteks nvidia/Nemotron-120B-A12B?+

nvidia/Nemotron-120B-A12B mendukung hingga jendela konteks token 202K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.

Apakah nvidia/Nemotron-120B-A12B lebih murah dibandingkan model AI lainnya?+

Dalam rangkaian terlacak HotON.ai, nvidia/Nemotron-120B-A12B lebih murah dibandingkan 51% model dalam hal harga input dan menempati peringkat #95 dari 535 berdasarkan efisiensi keseluruhan.

Apakah ada alternatif yang lebih murah selain nvidia/Nemotron-120B-A12B?+

Kutip model ini

Siap untuk ditempelkan ke dalam artikel, makalah, atau permintaan AI — harga dan tanggal diperbarui dengan data langsung.

HotON.ai — nvidia/Nemotron-120B-A12B (Baseten Model APIs): $0.30/1M input, $0.75/1M output, as of 2026-05-11. https://hoton.ai/id/models/baseten-nvidia-nemotron-120b-a12b