USTestoNVIDIA In diretta · aggiornato quotidianamente

nvidia/Nemotron-120B-A12B

Baseten Model APIs

Punteggio di efficienza

90/100

Prezzo d'ingresso

$0.30/1 milione di gettoni

Prezzo di produzione

$0.75/1 milione di gettoni

Finestra di contesto

202K

Prezzo misto

$0.64/1 milione di gettoni

Costo/compito

$0.001

Avviso di calo dei prezzi

Ricevi un'e-mail quando il prezzo combinato di questo modello scende. Nessun account necessario.

Una e-mail per goccia. Annulla l'iscrizione in qualsiasi momento.

Capacità

Accetta (input)

Testo

Produce (uscita)

Testo

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.30/1 milione di gettoni

$0.0003 /1K

Prezzo di produzione

$0.75/1 milione di gettoni

$0.0008 /1K

Prezzo misto

$0.64/1 milione di gettoni

$0.0006 /1K

Tipico mix output-input 3:1, per 1 milione di token

Prezzo a partire da 2026-05-11 · Fonte: baseten_reference_catalog

Costo mensile stimato per carico di lavoro

Assistente di chat

$180.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$427.50/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$486.00/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Posizione di mercato

Più economico del 51% dei modelli cingolati
Contesto più ampio rispetto al 67% dei modelli monitorati
Grado di efficienza: #105 di 535

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di nvidia/Nemotron-120B-A12B

Percorso API modello Baseten per Nemotron Super, aggiungendo una riga di ragionamento NVIDIA a contesto lungo con campi di prezzo dell'API modello gestito.

nvidia/Nemotron-120B-A12B è un modello Testo di Baseten Model APIs (US). HotON.ai lo tiene traccia di $0.30 per 1 milione di token di input e $0.75 per 1 milione di token di output, con una finestra di contesto del token 202K. Il suo punteggio di efficienza composito è 90/100 con un $0.001 stimato per attività riuscita.

Confronta nvidia/Nemotron-120B-A12B

NVIDIA vs QWEN3.6-FLASH NVIDIA vs QWEN3-235B-A22 NVIDIA vs ACCOUNTS NVIDIA vs JAMBA-MINI-2

Notizie di mercato correlate

L'agente IA canaglia di OpenAI ha hackerato molto più che limitarsi ad abbracciare il viso4 ore fa Cyera accetta di acquisire Oasis Security per 1 miliardo di dollari per salvaguardare la proliferazione degli agenti IA4 ore fa Creazione di flussi di lavoro di codifica agenti non interattivi con Kimi CLI di Moonshot AI, streaming JSONL, test e memoria di sessione5 ore fa

Domande frequenti

Quanto costa nvidia/Nemotron-120B-A12B per 1 milione di token?+

nvidia/Nemotron-120B-A12B viene tracciato su $0.30 per 1 milione di token di input e $0.75 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.64 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.

Per cosa è meglio nvidia/Nemotron-120B-A12B?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di nvidia/Nemotron-120B-A12B?+

nvidia/Nemotron-120B-A12B supporta fino a una finestra di contesto del token 202K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

nvidia/Nemotron-120B-A12B è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, nvidia/Nemotron-120B-A12B è più economico della 51% dei modelli sul prezzo di input e si classifica #105 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a nvidia/Nemotron-120B-A12B?+

Sì: deepseek-v4-flash è un'opzione a costo inferiore a $0.28 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.

Cita questo modello

Pronto per essere incollato in articoli, documenti o richieste di intelligenza artificiale: i prezzi e la data si aggiornano con i dati in tempo reale.

HotON.ai — nvidia/Nemotron-120B-A12B (Baseten Model APIs): $0.30/1M input, $0.75/1M output, as of 2026-05-11. https://hoton.ai/it/models/baseten-nvidia-nemotron-120b-a12b

Modelli correlati

accounts/fireworks/models/minimax-m2p5

Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. L’efficienza è un modello composito di prezzo reale e contesto.

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.30/1 milione di gettoni

$0.0003 /1K

Prezzo di produzione

$0.75/1 milione di gettoni

$0.0008 /1K

Prezzo misto

$0.64/1 milione di gettoni

$0.0006 /1K

Tipico mix output-input 3:1, per 1 milione di token

Prezzo a partire da 2026-05-11 · Fonte: baseten_reference_catalog

Costo mensile stimato per carico di lavoro

Assistente di chat

$180.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$427.50/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$486.00/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di nvidia/Nemotron-120B-A12B

Percorso API modello Baseten per Nemotron Super, aggiungendo una riga di ragionamento NVIDIA a contesto lungo con campi di prezzo dell'API modello gestito.

Domande frequenti

Quanto costa nvidia/Nemotron-120B-A12B per 1 milione di token?+

Per cosa è meglio nvidia/Nemotron-120B-A12B?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di nvidia/Nemotron-120B-A12B?+

nvidia/Nemotron-120B-A12B supporta fino a una finestra di contesto del token 202K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

nvidia/Nemotron-120B-A12B è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, nvidia/Nemotron-120B-A12B è più economico della 51% dei modelli sul prezzo di input e si classifica #105 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a nvidia/Nemotron-120B-A12B?+

Sì: deepseek-v4-flash è un'opzione a costo inferiore a $0.28 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.

Cita questo modello

Pronto per essere incollato in articoli, documenti o richieste di intelligenza artificiale: i prezzi e la data si aggiornano con i dati in tempo reale.

HotON.ai — nvidia/Nemotron-120B-A12B (Baseten Model APIs): $0.30/1M input, $0.75/1M output, as of 2026-05-11. https://hoton.ai/it/models/baseten-nvidia-nemotron-120b-a12b