使用可能なテキスト生成の最低価格は崩壊しました。 489 のライブ世代モデル全体で、市場の底値がどの程度低くなり、どの程度混雑しているのかをマッピングしました。
私たちが追跡している最も安価な世代モデルである Llama-3.2-3B-Instruct は、3:1 ブレンドで 100 万トークンあたり約 $0.020 を実行します。これはタイプミスではありません。小型で効率的なモデルは最低価格をゼロに近づけ、ローエンドの品質は向上し続けています。
489 世代モデルの 234 のコストは 100 万トークンあたり 1 ドル未満になり、161 は 0.50 ドル未満になります。一方、カタログ平均の中で最も高価な 10 分の 1 は $49.94 です。大量の価格重視の作業の場合、安価なレベルはもはや妥協ではなく、デフォルトです。
通常、最低価格とは、モデルが小さく、コンテキストが短く、モダリティが少ないことを意味します。ルーティング、分類、抽出、一括ドラフトには問題ありませんが、最も難しい推論にはそれほど問題はありません。モデルを仕事に合わせます。できる限り安く、目に見えて利益が得られる場合にのみプレミアムを選択します。以下の地図は、価格と効率をプロットしたものです。
すべての追跡されたモデルは、入力価格 (対数スケール) と複合効率によってプロットされます。左上に向かうほど、1 ドルあたりの価値が高くなります。
各ドットは 1 つのモデルです。 · カラー = 領域 · ドットをクリックして開きます。
価格は実際のものです (OpenRouter 経由、毎日更新されます)。これは市場分析であり、投資や調達のアドバイスではありません。