USTestoLLEMMA-7B In diretta · aggiornato quotidianamente

llemma_7b

Eleutherai

Punteggio di efficienza

88/100

Prezzo d'ingresso

$0.80/1 milione di gettoni

Prezzo di produzione

$1.20/1 milione di gettoni

Finestra di contesto

Prezzo misto

$1.10/1 milione di gettoni

Costo/compito

$0.002

Avviso di calo dei prezzi

Ricevi un'e-mail quando il prezzo combinato di questo modello scende. Nessun account necessario.

Una e-mail per goccia. Annulla l'iscrizione in qualsiasi momento.

Capacità

Accetta (input)

Testo

Produce (uscita)

Testo

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.80/1 milione di gettoni

$0.0008 /1K

Prezzo di produzione

$1.20/1 milione di gettoni

$0.0012 /1K

Prezzo misto

$1.10/1 milione di gettoni

$0.0011 /1K

Tipico mix output-input 3:1, per 1 milione di token

Prezzo a partire da 2026-05-11 · Fonte: eleutherai_reference_catalog

Costo mensile stimato per carico di lavoro

Assistente di chat

$384.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$1,068/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$1,008/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Posizione di mercato

Più economico del 35% dei modelli cingolati
Contesto più ampio rispetto al 4% dei modelli monitorati
Grado di efficienza: #337 di 535

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di llemma_7b

Il lemma 7B è un modello linguistico per la matematica. È stato inizializzato con pesi Code Llama 7B e addestrato su Proof-Pile-2 per token da 200B. I modelli Llemma sono particolarmente forti in...

llemma_7b è un modello Testo di Eleutherai (US). HotON.ai lo tiene traccia di $0.80 per 1 milione di token di input e $1.20 per 1 milione di token di output, con una finestra di contesto del token 4K. Il suo punteggio di efficienza composito è 88/100 con un $0.002 stimato per attività riuscita.

Confronta llemma_7b

LLEMMA-7B vs GLM-5-TURBO LLEMMA-7B vs BAICHUAN3-TURB LLEMMA-7B vs RERANK-2.5 LLEMMA-7B vs AION-2.5-API

Notizie di mercato correlate

L'agente IA canaglia di OpenAI ha hackerato molto più che limitarsi ad abbracciare il viso4 ore fa Cyera accetta di acquisire Oasis Security per 1 miliardo di dollari per salvaguardare la proliferazione degli agenti IA4 ore fa Creazione di flussi di lavoro di codifica agenti non interattivi con Kimi CLI di Moonshot AI, streaming JSONL, test e memoria di sessione5 ore fa

Domande frequenti

Quanto costa llemma_7b per 1 milione di token?+

llemma_7b viene tracciato su $0.80 per 1 milione di token di input e $1.20 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $1.10 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.

Per cosa è meglio llemma_7b?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di llemma_7b?+

llemma_7b supporta fino a una finestra di contesto del token 4K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

llemma_7b è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, llemma_7b è più economico della 35% dei modelli sul prezzo di input e si classifica #337 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a llemma_7b?+

Sì: minimax-m2.7 è un'opzione a costo inferiore a $1.20 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.

Cita questo modello

Pronto per essere incollato in articoli, documenti o richieste di intelligenza artificiale: i prezzi e la data si aggiornano con i dati in tempo reale.

HotON.ai — llemma_7b (Eleutherai): $0.80/1M input, $1.20/1M output, as of 2026-05-11. https://hoton.ai/it/models/eleutherai-llemma-7b

Modelli correlati

Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. L’efficienza è un modello composito di prezzo reale e contesto.

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.80/1 milione di gettoni

$0.0008 /1K

Prezzo di produzione

$1.20/1 milione di gettoni

$0.0012 /1K

Prezzo misto

$1.10/1 milione di gettoni

$0.0011 /1K

Tipico mix output-input 3:1, per 1 milione di token

Costo mensile stimato per carico di lavoro

Assistente di chat

$384.00/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$1,068/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$1,008/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di llemma_7b

Domande frequenti

Quanto costa llemma_7b per 1 milione di token?+

Per cosa è meglio llemma_7b?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di llemma_7b?+

llemma_7b supporta fino a una finestra di contesto del token 4K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

llemma_7b è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, llemma_7b è più economico della 35% dei modelli sul prezzo di input e si classifica #337 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a llemma_7b?+

Sì: minimax-m2.7 è un'opzione a costo inferiore a $1.20 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.