USTestoGPT-OSS-120B In diretta · aggiornato quotidianamente

gpt-oss-120b

Cerebras

Punteggio di efficienza

89/100

Prezzo d'ingresso

$0.15/1 milione di gettoni

Prezzo di produzione

$0.60/1 milione di gettoni

Finestra di contesto

131K

Prezzo misto

$0.49/1 milione di gettoni

Costo/compito

$0.001

Avviso di calo dei prezzi

Ricevi un'e-mail quando il prezzo combinato di questo modello scende. Nessun account necessario.

Una e-mail per goccia. Annulla l'iscrizione in qualsiasi momento.

Capacità

Accetta (input)

Testo

Produce (uscita)

Testo

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.15/1 milione di gettoni

$0.0001 /1K

Prezzo di produzione

$0.60/1 milione di gettoni

$0.0006 /1K

Prezzo misto

$0.49/1 milione di gettoni

$0.0005 /1K

Tipico mix output-input 3:1, per 1 milione di token

Fonte: litellm

Costo mensile stimato per carico di lavoro

Assistente di chat

$117.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$234.00/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$324.00/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Posizione di mercato

Più economico del 70% dei modelli cingolati
Contesto più ampio rispetto al 39% dei modelli monitorati
Grado di efficienza: #241 di 535

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di gpt-oss-120b

GPT-OSS 120B su Cerebras è un modello di ragionamento di produzione open-weight per chat veloci, strumenti e codifica.

gpt-oss-120b è un modello Testo di Cerebras (US). HotON.ai lo tiene traccia di $0.15 per 1 milione di token di input e $0.60 per 1 milione di token di output, con una finestra di contesto del token 131K. Il suo punteggio di efficienza composito è 89/100 con un $0.001 stimato per attività riuscita.

Confronta gpt-oss-120b

GPT-OSS-120B vs MERCURY-2-INST GPT-OSS-120B vs MORPH-RERANK-V GPT-OSS-120B vs SOLAR-PRO-3 GPT-OSS-120B vs CYDONIA-24B-V4

Notizie di mercato correlate

L'agente IA canaglia di OpenAI ha hackerato molto più che limitarsi ad abbracciare il viso5 ore fa Cyera accetta di acquisire Oasis Security per 1 miliardo di dollari per salvaguardare la proliferazione degli agenti IA5 ore fa Creazione di flussi di lavoro di codifica agenti non interattivi con Kimi CLI di Moonshot AI, streaming JSONL, test e memoria di sessione7 ore fa

Domande frequenti

Quanto costa gpt-oss-120b per 1 milione di token?+

gpt-oss-120b viene tracciato su $0.15 per 1 milione di token di input e $0.60 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.49 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.

Per cosa è meglio gpt-oss-120b?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di gpt-oss-120b?+

gpt-oss-120b supporta fino a una finestra di contesto del token 131K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

gpt-oss-120b è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, gpt-oss-120b è più economico della 70% dei modelli sul prezzo di input e si classifica #241 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a gpt-oss-120b?+

Sì: deepseek-v4-flash è un'opzione a costo inferiore a $0.28 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.

Cita questo modello

Pronto per essere incollato in articoli, documenti o richieste di intelligenza artificiale: i prezzi e la data si aggiornano con i dati in tempo reale.

HotON.ai — gpt-oss-120b (Cerebras): $0.15/1M input, $0.60/1M output. https://hoton.ai/it/models/cerebras-gpt-oss-120b

Modelli correlati

Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. L’efficienza è un modello composito di prezzo reale e contesto.

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.15/1 milione di gettoni

$0.0001 /1K

Prezzo di produzione

$0.60/1 milione di gettoni

$0.0006 /1K

Prezzo misto

$0.49/1 milione di gettoni

$0.0005 /1K

Tipico mix output-input 3:1, per 1 milione di token

Costo mensile stimato per carico di lavoro

Assistente di chat

$117.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$234.00/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$324.00/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di gpt-oss-120b

GPT-OSS 120B su Cerebras è un modello di ragionamento di produzione open-weight per chat veloci, strumenti e codifica.

Domande frequenti

Quanto costa gpt-oss-120b per 1 milione di token?+

Per cosa è meglio gpt-oss-120b?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di gpt-oss-120b?+

gpt-oss-120b supporta fino a una finestra di contesto del token 131K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

gpt-oss-120b è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, gpt-oss-120b è più economico della 70% dei modelli sul prezzo di input e si classifica #241 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a gpt-oss-120b?+

Sì: deepseek-v4-flash è un'opzione a costo inferiore a $0.28 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.