Kullanılabilir metin oluşturmaya yönelik taban fiyat çöktü. 489 canlı nesil modellerinde, pazarın tabanının ne kadar düşük ve ne kadar kalabalık hale geldiğini haritaladık.
Takip ettiğimiz en ucuz nesil model olan Llama-3.2-3B-Instruct, 3:1 karışımda 1 milyon token başına yaklaşık $0.020 çalıştırıyor. Bu bir yazım hatası değil; küçük, verimli modeller zemini sıfıra yaklaştırdı ve alt uçtaki kalite yükselmeye devam ediyor.
489 nesil modellerin 234'sının maliyeti artık 1 milyon token başına 1 doların altında ve 161'ın maliyeti 0,50 doların altında. Bu arada katalog ortalamalarının en pahalı onda biri $49.94'dir. Yüksek hacimli, fiyata duyarlı işler için ucuz katman artık bir uzlaşma değil, varsayılan seçenektir.
En düşük fiyatlar genellikle daha küçük modeller, daha kısa bağlam veya daha az yöntem anlamına gelir; yönlendirme, sınıflandırma, çıkarma ve toplu taslak hazırlama için iyi, en zor mantık yürütme için ise daha az. Modeli işinizle eşleştirin: Yapabildiğiniz yerde ucuz, yalnızca ölçülebilir şekilde ödediği yerde premium. Aşağıdaki harita fiyat ile verimliliği karşılaştırıyor.
Takip edilen her model, girdi fiyatına (log ölçeği) ve bileşik verimliliğe göre çizilir. Sol üste doğru dolar başına daha iyi değer anlamına gelir.
Her nokta bir modeldir · renk = bölge · açmak için bir noktayı tıklayın.
Fiyatlandırma gerçektir (OpenRouter aracılığıyla, günlük olarak güncellenir). Bu pazar analizidir, yatırım veya satın alma tavsiyesi değildir.