Le prix plancher pour la génération de texte utilisable s’est effondré. Sur les modèles de génération live 489, nous avons cartographié à quel point le bas du marché est devenu bas et encombré.
Le modèle de génération le moins cher que nous suivons, Llama-3.2-3B-Instruct, fonctionne environ $0.020 pour 1 million de jetons sur un mélange 3:1. Ce n’est pas une faute de frappe : les modèles petits et efficaces ont poussé le plancher près de zéro, et la qualité bas de gamme continue d’augmenter.
Les modèles 234 de la génération 489 coûtent désormais moins de 1 $ pour 1 million de jetons, et 161 coûte moins de 0,50 $. Pendant ce temps, le dixième le plus cher du catalogue est en moyenne $49.94. Pour les travaux volumineux et sensibles au prix, le niveau bon marché n’est plus un compromis : c’est la valeur par défaut.
Des prix très bas signifient généralement des modèles plus petits, un contexte plus court ou moins de modalités – parfait pour le routage, la classification, l'extraction et la rédaction en masse, moins pour le raisonnement le plus difficile. Adaptez le modèle à l’emploi : bon marché là où vous le pouvez, premium uniquement là où cela rapporte de manière mesurable. La carte ci-dessous représente le prix par rapport à l’efficacité.
Chaque modèle suivi est représenté par prix des intrants (échelle logarithmique) et efficacité composite. Vers le coin supérieur gauche signifie une meilleure valeur par dollar.
Chaque point est un modèle · couleur = région · cliquez sur un point pour l'ouvrir.
Le prix est réel (via OpenRouter, mis à jour quotidiennement). Il s’agit d’une analyse de marché et non de conseils en matière d’investissement ou d’approvisionnement.