Miscelato $/1 milione tra le versioni tracciate di questa linea.
Tipico mix output-input 3:1, per 1 milione di token
Fonte: litellm
Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.
OpenAI GPT Realtime 1.5 is a realtime voice model for audio-in/audio-out voice agent workflows.
gpt-realtime-1.5 è un modello Testo di OpenAI (US). HotON.ai lo tiene traccia di $4.00 per 1 milione di token di input e $16.00 per 1 milione di token di output, con una finestra di contesto del token 32K. Il suo punteggio di efficienza composito è 81/100 con un $0.016 stimato per attività riuscita.
gpt-realtime-1.5 viene tracciato su $4.00 per 1 milione di token di input e $16.00 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $13.00 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.
Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.
gpt-realtime-1.5 supporta fino a una finestra di contesto del token 32K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.
All'interno dell'insieme tracciato HotON.ai, gpt-realtime-1.5 è più economico della 7% dei modelli sul prezzo di input e si classifica #495 di 521 in base all'efficienza complessiva.
Sì: minimax-m2.5 è un'opzione a costo inferiore a $0.99 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.
Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. Velocità, disponibilità ed efficienza sono stime modellate.