Il prezzo minimo per la generazione di testo utilizzabile è crollato. Attraverso i modelli di generazione live 489, abbiamo mappato quanto basso – e quanto affollato – sia diventato il fondo del mercato.
Il modello della generazione più economica da noi monitorata, Llama-3.2-3B-Instruct, esegue circa $0.020 per 1 milione di token su una miscela 3:1. Non si tratta di un errore di battitura: i modelli piccoli ed efficienti hanno spinto il livello vicino allo zero e la qualità nella fascia bassa continua a salire.
I modelli 234 della generazione 489 ora costano meno di 1 dollaro per 1 milione di token, mentre i modelli 161 costano meno di 0,50 dollari. Nel frattempo, il decimo più costoso del catalogo è in media $49.94. Per i lavori ad alto volume e sensibili al prezzo, il livello economico non è più un compromesso: è quello predefinito.
I prezzi più bassi di solito significano modelli più piccoli, contesto più breve o meno modalità: va bene per l'instradamento, la classificazione, l'estrazione e la stesura di massa, meno per i ragionamenti più difficili. Abbina il modello al lavoro: economico dove puoi, premium solo dove paga in modo misurabile. La mappa seguente traccia il rapporto tra prezzo e efficienza.
Ogni modello tracciato è tracciato in base al prezzo degli input (scala logaritmica) e all'efficienza composita. Verso l'alto a sinistra significa un migliore valore per dollaro.
Ogni punto è un modello · colore = regione · fare clic su un punto per aprirlo.
Il prezzo è reale (tramite OpenRouter, aggiornato quotidianamente). Questa è un'analisi di mercato, non una consulenza sugli investimenti o sugli appalti.