Die Preisuntergrenze für nutzbare Textgenerierung ist zusammengebrochen. Anhand der 489-Live-Generation-Modelle haben wir ermittelt, wie niedrig – und wie überfüllt – der unterste Markt ist.
Das Modell der günstigsten Generation, das wir verfolgen, Llama-3.2-3B-Instruct, läuft etwa $0.020 pro 1 Mio. Token bei einer 3:1-Mischung. Das ist kein Tippfehler – kleine, effiziente Modelle haben den Standard fast auf Null gebracht, und die Qualität im unteren Preissegment steigt weiter.
234 der 489-Generationsmodelle kosten jetzt weniger als 1 US-Dollar pro 1 Million Token, und 161 kostet weniger als 0,50 US-Dollar. Mittlerweile liegt das teuerste Zehntel des Katalogs im Durchschnitt bei $49.94. Für hochvolumige, preissensible Arbeiten ist die günstige Stufe kein Kompromiss mehr – sie ist die Standardeinstellung.
Tiefstpreise bedeuten in der Regel kleinere Modelle, kürzeren Kontext oder weniger Modalitäten – gut für Routing, Klassifizierung, Extraktion und Massenentwurf, weniger für die härtesten Argumente. Passen Sie das Modell an den Job an: günstig, wo es geht, Premium nur dort, wo es sich messbar lohnt. Die Karte unten zeigt den Preis im Verhältnis zur Effizienz.
Jedes verfolgte Modell wird nach Eingabepreis (logarithmische Skala) und zusammengesetzter Effizienz dargestellt. Nach oben links bedeutet ein besseres Preis-Leistungs-Verhältnis pro Dollar.
Jeder Punkt ist ein Modell · Farbe = Region · Klicken Sie auf einen Punkt, um ihn zu öffnen.
Die Preise sind real (über OpenRouter, täglich aktualisiert). Hierbei handelt es sich um eine Marktanalyse, nicht um eine Investitions- oder Beschaffungsberatung.