Precio combinado diario ($/1 millón): registrado cada día, genera una tendencia con el tiempo.
Mezcla típica de salida a entrada 3:1, por 1 millón de tokens
Fuente: litellm
Cargas de trabajo de generación de texto, chat, resúmenes y contenido de uso general donde la amplia capacidad y el bajo costo son lo más importante.
OpenAI realtime model for low-latency text, image, and audio interaction.
gpt-realtime es un modelo Texto de OpenAI (US). HotON.ai lo rastrea en $4.00 por 1 millón de tokens de entrada y $16.00 por 1 millón de tokens de salida, con una ventana contextual de token 1K. Su puntuación de eficiencia compuesta es 81/100 con un $0.016 estimado por tarea exitosa.
gpt-realtime se rastrea en $4.00 por 1 millón de tokens de entrada y $16.00 por 1 millón de tokens de salida. Una carga de trabajo típica de salida a entrada de 3:1 se combina aproximadamente con $13.00 por 1 millón de tokens. Las cifras son datos de demostración ilustrativos.
Cargas de trabajo de generación de texto, chat, resúmenes y contenido de uso general donde la amplia capacidad y el bajo costo son lo más importante.
gpt-realtime admite hasta una ventana contextual de token 1K, lo suficientemente grande para documentos largos y conversaciones extensas en una sola solicitud.
Dentro del conjunto de seguimiento HotON.ai, gpt-realtime es más barato que el % 7 de los modelos en cuanto al precio de entrada y ocupa el puesto #496 de 521 por eficiencia general.
Sí, minimax-m2.5 es una opción de menor costo en $0.99 por 1 millón de tokens de salida, y al mismo tiempo cubre casos de uso similares de Texto. Compárelos uno al lado del otro en HotON.ai.
El precio es real (a través del catálogo TestKey, actualizado diariamente). La calidad (Arena Elo) es real donde el modelo se clasifica en LMArena. La velocidad, la disponibilidad y la eficiencia son estimaciones modeladas.