Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.
Tipico mix output-input 3:1, per 1 milione di token
Prezzo a partire da 2026-04-28 · Fonte: legacy_model_catalog
Carichi di lavoro misti di testo, immagini, audio e documenti che beneficiano di un unico modello in tutte le modalità.
The Qwen3.5 native vision-language Flash models are built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. Compared t...
qwen3.5-flash-02-23 è un modello Multimodale di Alibaba Cloud · Qwen (CN). HotON.ai lo tiene traccia di $0.07 per 1 milione di token di input e $0.26 per 1 milione di token di output, con una finestra di contesto del token 1000K. Il suo punteggio di efficienza composito è 96/100 con un $0.000 stimato per attività riuscita.
qwen3.5-flash-02-23 viene tracciato su $0.07 per 1 milione di token di input e $0.26 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.21 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.
Carichi di lavoro misti di testo, immagini, audio e documenti che beneficiano di un unico modello in tutte le modalità.
qwen3.5-flash-02-23 supporta fino a una finestra di contesto del token 1000K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.
All'interno dell'insieme tracciato HotON.ai, qwen3.5-flash-02-23 è più economico della 88% dei modelli sul prezzo di input e si classifica #25 di 521 in base all'efficienza complessiva.
Sì: amazon.nova-lite-v1:0 è un'opzione a costo inferiore a $0.24 per 1 milione di token di output, pur coprendo casi d'uso Multimodale simili. Confrontali fianco a fianco su HotON.ai.
Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. Velocità, disponibilità ed efficienza sono stime modellate.