USTestoQWEN3-4B In diretta · aggiornato quotidianamente

Qwen3-4B

Prime Intellect

Punteggio di efficienza

89/100

Prezzo d'ingresso

$0.08/1 milione di gettoni

Prezzo di produzione

$0.24/1 milione di gettoni

Finestra di contesto

33K

Prezzo misto

$0.20/1 milione di gettoni

Costo/compito

$0.000

Avviso di calo dei prezzi

Ricevi un'e-mail quando il prezzo combinato di questo modello scende. Nessun account necessario.

Una e-mail per goccia. Annulla l'iscrizione in qualsiasi momento.

Capacità

Accetta (input)

Testo

Produce (uscita)

Testo

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.08/1 milione di gettoni

$0.0001 /1K

Prezzo di produzione

$0.24/1 milione di gettoni

$0.0002 /1K

Prezzo misto

$0.20/1 milione di gettoni

$0.0002 /1K

Tipico mix output-input 3:1, per 1 milione di token

Fonte: litellm

Costo mensile stimato per carico di lavoro

Assistente di chat

$52.80/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$117.60/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$144.00/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Posizione di mercato

Più economico del 85% dei modelli cingolati
Contesto più ampio rispetto al 18% dei modelli monitorati
Grado di efficienza: #187 di 535

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di Qwen3-4B

Prime Intellect Qwen3 4B è una scheda modello Qwen3 di medie dimensioni per la precompilazione e il confronto dei fornitori.

Qwen3-4B è un modello Testo di Prime Intellect (US). HotON.ai lo tiene traccia di $0.08 per 1 milione di token di input e $0.24 per 1 milione di token di output, con una finestra di contesto del token 33K. Il suo punteggio di efficienza composito è 89/100 con un $0.000 stimato per attività riuscita.

Confronta Qwen3-4B

QWEN3-4B vs MERCURY-2-INST QWEN3-4B vs MORPH-RERANK-V QWEN3-4B vs SOLAR-PRO-3 QWEN3-4B vs CYDONIA-24B-V4

Notizie di mercato correlate

L'agente IA canaglia di OpenAI ha hackerato molto più che limitarsi ad abbracciare il viso9 ore fa Cyera accetta di acquisire Oasis Security per 1 miliardo di dollari per salvaguardare la proliferazione degli agenti IA9 ore fa Creazione di flussi di lavoro di codifica agenti non interattivi con Kimi CLI di Moonshot AI, streaming JSONL, test e memoria di sessione10 ore fa

Domande frequenti

Quanto costa Qwen3-4B per 1 milione di token?+

Qwen3-4B viene tracciato su $0.08 per 1 milione di token di input e $0.24 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.20 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.

Per cosa è meglio Qwen3-4B?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di Qwen3-4B?+

Qwen3-4B supporta fino a una finestra di contesto del token 33K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

Qwen3-4B è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, Qwen3-4B è più economico della 85% dei modelli sul prezzo di input e si classifica #187 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a Qwen3-4B?+

Sì: qwen3-235b-a22b-2507 è un'opzione a costo inferiore a $0.10 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.

Cita questo modello

Pronto per essere incollato in articoli, documenti o richieste di intelligenza artificiale: i prezzi e la data si aggiornano con i dati in tempo reale.

HotON.ai — Qwen3-4B (Prime Intellect): $0.08/1M input, $0.24/1M output. https://hoton.ai/it/models/primeintellect-qwen3-4b

Modelli correlati

Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. L’efficienza è un modello composito di prezzo reale e contesto.

Prezzo nel tempo

Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.

Ripartizione dei prezzi

Prezzo d'ingresso

$0.08/1 milione di gettoni

$0.0001 /1K

Prezzo di produzione

$0.24/1 milione di gettoni

$0.0002 /1K

Prezzo misto

$0.20/1 milione di gettoni

$0.0002 /1K

Tipico mix output-input 3:1, per 1 milione di token

Costo mensile stimato per carico di lavoro

Assistente di chat

$52.80/mese

1.000 in entrata · 400 in uscita · 10.000 richieste/giorno

RAG / contesto lungo

$117.60/mese

8.000 in entrata · 600 in uscita · 5.000 richieste/giorno

Utilizzo dell'agente/strumento

$144.00/mese

3.000 in ingresso · 1,5.000 in uscita · 8.000 richieste/giorno

Stimare il costo →

Più adatto per

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

A proposito di Qwen3-4B

Prime Intellect Qwen3 4B è una scheda modello Qwen3 di medie dimensioni per la precompilazione e il confronto dei fornitori.

Domande frequenti

Quanto costa Qwen3-4B per 1 milione di token?+

Per cosa è meglio Qwen3-4B?+

Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.

Quanto è grande la finestra di contesto di Qwen3-4B?+

Qwen3-4B supporta fino a una finestra di contesto del token 33K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.

Qwen3-4B è più economico di altri modelli AI?+

All'interno dell'insieme tracciato HotON.ai, Qwen3-4B è più economico della 85% dei modelli sul prezzo di input e si classifica #187 di 535 in base all'efficienza complessiva.

Esiste un'alternativa più economica a Qwen3-4B?+

Sì: qwen3-235b-a22b-2507 è un'opzione a costo inferiore a $0.10 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.