USTestoLLAMA-3.3-70B In diretta · aggiornato quotidianamente

llama-3.3-70b

Cerebras

Punteggio di efficienza

88/100

Prezzo d'ingresso

$0.85/1 milione di gettoni

Prezzo di produzione

$1.20/1 milione di gettoni

Finestra di contesto

Prezzo misto

$1.11/1 milione di gettoni

Costo/compito

$0.002

Avviso di calo dei prezzi

Ricevi un'e-mail quando il prezzo combinato di questo modello scende. Nessun account necessario.

Una e-mail per goccia. Annulla l'iscrizione in qualsiasi momento.

Capacità

Accetta (input)

Testo

Produce (uscita)

Testo

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.85/1 milione di gettoni

$0.0008 /1K

Prezzo di produzione

$1.20/1 milione di gettoni

$0.0012 /1K

Prezzo misto

$1.11/1 milione di gettoni

$0.0011 /1K

Tipico mix output-input 3:1, per 1 milione di token

Prezzo a partire da 2026-05-10 · Fonte: cerebras_official_pricing

Costo mensile stimato per carico di lavoro

Assistente di chat

$399.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$1,128/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$1,044/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Posizione di mercato

Più economico del 33% dei modelli cingolati
Contesto più ampio rispetto al 6% dei modelli monitorati
Grado di efficienza: #343 di 535

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di llama-3.3-70b

Llama 3.3 70B su Cerebras è un modello aperto ad alto rendimento per chat e generazione.

llama-3.3-70b è un modello Testo di Cerebras (US). HotON.ai lo tiene traccia di $0.85 per 1 milione di token di input e $1.20 per 1 milione di token di output, con una finestra di contesto del token 8K. Il suo punteggio di efficienza composito è 88/100 con un $0.002 stimato per attività riuscita.

Confronta llama-3.3-70b

LLAMA-3.3-70B vs GLM-5-TURBO LLAMA-3.3-70B vs BAICHUAN3-TURB LLAMA-3.3-70B vs RERANK-2.5 LLAMA-3.3-70B vs AION-2.5-API

Notizie di mercato correlate

L'agente IA canaglia di OpenAI ha hackerato molto più che limitarsi ad abbracciare il viso4 ore fa Cyera accetta di acquisire Oasis Security per 1 miliardo di dollari per salvaguardare la proliferazione degli agenti IA4 ore fa Creazione di flussi di lavoro di codifica agenti non interattivi con Kimi CLI di Moonshot AI, streaming JSONL, test e memoria di sessione5 ore fa

Domande frequenti

Quanto costa llama-3.3-70b per 1 milione di token?+

llama-3.3-70b viene tracciato su $0.85 per 1 milione di token di input e $1.20 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $1.11 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.

Per cosa è meglio llama-3.3-70b?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di llama-3.3-70b?+

llama-3.3-70b supporta fino a una finestra di contesto del token 8K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

llama-3.3-70b è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, llama-3.3-70b è più economico della 33% dei modelli sul prezzo di input e si classifica #343 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a llama-3.3-70b?+

Sì: minimax-m2.7 è un'opzione a costo inferiore a $1.20 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.

Cita questo modello

Pronto per essere incollato in articoli, documenti o richieste di intelligenza artificiale: i prezzi e la data si aggiornano con i dati in tempo reale.

HotON.ai — llama-3.3-70b (Cerebras): $0.85/1M input, $1.20/1M output, as of 2026-05-10. https://hoton.ai/it/models/cerebras-llama-3-3-70b

Modelli correlati

Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. L’efficienza è un modello composito di prezzo reale e contesto.

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.85/1 milione di gettoni

$0.0008 /1K

Prezzo di produzione

$1.20/1 milione di gettoni

$0.0012 /1K

Prezzo misto

$1.11/1 milione di gettoni

$0.0011 /1K

Tipico mix output-input 3:1, per 1 milione di token

Prezzo a partire da 2026-05-10 · Fonte: cerebras_official_pricing

Costo mensile stimato per carico di lavoro

Assistente di chat

$399.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$1,128/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$1,044/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di llama-3.3-70b

Llama 3.3 70B su Cerebras è un modello aperto ad alto rendimento per chat e generazione.

Domande frequenti

Quanto costa llama-3.3-70b per 1 milione di token?+

Per cosa è meglio llama-3.3-70b?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di llama-3.3-70b?+

llama-3.3-70b supporta fino a una finestra di contesto del token 8K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

llama-3.3-70b è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, llama-3.3-70b è più economico della 33% dei modelli sul prezzo di input e si classifica #343 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a llama-3.3-70b?+

Sì: minimax-m2.7 è un'opzione a costo inferiore a $1.20 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.