El precio mínimo para la generación de texto utilizable se ha derrumbado. En todos los modelos de generación en vivo 489, mapeamos cuán bajo (y cuán concurrido) se ha vuelto el fondo del mercado.
El modelo de generación más barato que rastreamos, Llama-3.2-3B-Instruct, ejecuta alrededor de $0.020 por 1 millón de tokens en una combinación de 3:1. Eso no es un error tipográfico: los modelos pequeños y eficientes han llevado el piso cerca de cero, y la calidad en el extremo inferior sigue aumentando.
Los modelos 234 de la generación 489 ahora cuestan menos de $1 por cada millón de tokens, y 161 cuestan menos de $0,50. Mientras tanto, el décimo más caro del catálogo promedia $49.94. Para trabajos de gran volumen y sensibles al precio, el nivel económico ya no es un compromiso: es el predeterminado.
Los precios bajísimos generalmente significan modelos más pequeños, contexto más corto o menos modalidades, lo que está bien para el enrutamiento, la clasificación, la extracción y la redacción masiva, no tanto para el razonamiento más difícil. Haga coincidir el modelo con el trabajo: barato donde sea posible, premium solo cuando pague de manera mensurable. El siguiente mapa muestra el precio frente a la eficiencia.
Cada modelo rastreado está trazado por el precio de los insumos (escala logarítmica) y la eficiencia compuesta. Hacia la parte superior izquierda significa un mejor valor por dólar.
Cada punto es un modelo · color = región · haga clic en un punto para abrirlo.
El precio es real (a través de OpenRouter, actualizado diariamente). Se trata de un análisis de mercado, no de asesoramiento sobre inversiones o adquisiciones.