価格が高いからといって、よりスマートなモデルが保証されるわけではありません。 LMArena スコアが公開されている 31 モデルの中で、実際のベンチマーク Elo をライブ価格に対してランク付けしました。
minimax-m3 は、LMArena の人間好みのリーダーボードで 1448 のスコアを獲得していますが、コストは 3:1 ブレンドで 100 万トークンあたり約 $0.97 のみです。これは、価格のほんの一部で最高のモデルの数ポイント以内です。 Benchmark Elo は実際のサードパーティ データであり、当社の推定値ではありません。
私たちが追跡している最高スコアのモデルである claude-opus-4.6 は、1M あたり約 $20.00 で 1504 の Elo を投稿します。バリュー リーダーは、価格がはるかに低いにもかかわらず、品質は著しく近くなります。そのため、ほとんどのワークロードでは、小さな (多くの場合気付かない) 品質の違いに対して多額の割増料金を支払っていることになります。
1 ドル当たりのインテリジェンスでは、強力で安価なモデルが好まれます。これを最後の単語ではなく、開始フィルターとして扱います。レイテンシ、コンテキスト ウィンドウ、ツールの使用、および独自の eval は依然として重要です。現在、31 モデルのみが公開 LMArena スコアを保持しているため、これはカタログ全体ではなく、測定されたフィールドをランク付けします。以下の地図は、価格と効率をプロットしたものです。
すべての追跡されたモデルは、入力価格 (対数スケール) と複合効率によってプロットされます。左上に向かうほど、1 ドルあたりの価値が高くなります。
各ドットは 1 つのモデルです。 · カラー = 領域 · ドットをクリックして開きます。
価格は本物 (OpenRouter 経由、毎日更新)、Elo も本物 (LMArena 経由)。これは市場分析であり、投資や調達のアドバイスではありません。