Precio combinado diario ($/1 millón): registrado cada día, genera una tendencia con el tiempo.
Mezcla típica de salida a entrada 3:1, por 1 millón de tokens
Precio a partir de 2026-05-11 · Fuente: meta_reference_catalog
Cargas de trabajo mixtas de texto, imágenes, audio y documentos que se benefician de un modelo en todas las modalidades.
Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...
llama-4-maverick es un modelo Multimodal de Meta (US). HotON.ai lo rastrea en $0.15 por 1 millón de tokens de entrada y $0.60 por 1 millón de tokens de salida, con una ventana contextual de token 1049K. Su puntuación de eficiencia compuesta es 96/100 con un $0.001 estimado por tarea exitosa.
llama-4-maverick se rastrea en $0.15 por 1 millón de tokens de entrada y $0.60 por 1 millón de tokens de salida. Una carga de trabajo típica de salida a entrada de 3:1 se combina aproximadamente con $0.49 por 1 millón de tokens. Las cifras son datos de demostración ilustrativos.
Cargas de trabajo mixtas de texto, imágenes, audio y documentos que se benefician de un modelo en todas las modalidades.
llama-4-maverick admite hasta una ventana contextual de token 1049K, lo suficientemente grande para documentos largos y conversaciones extensas en una sola solicitud.
Dentro del conjunto de seguimiento HotON.ai, llama-4-maverick es más barato que el % 69 de los modelos en cuanto al precio de entrada y ocupa el puesto #8 de 521 por eficiencia general.
Sí, gpt-4.1-nano es una opción de menor costo en $0.40 por 1 millón de tokens de salida, y al mismo tiempo cubre casos de uso similares de Multimodal. Compárelos uno al lado del otro en HotON.ai.
El precio es real (a través del catálogo TestKey, actualizado diariamente). La calidad (Arena Elo) es real donde el modelo se clasifica en LMArena. La velocidad, la disponibilidad y la eficiencia son estimaciones modeladas.