このラインの追跡バージョン全体で $/1M をブレンドしました。
一般的な 3:1 の出力と入力の組み合わせ (1M トークンあたり)
2026-05-10 時点の価格 · ソース: xai_official_pricing
複雑な推論、分析、計画、および複数のステップからなる問題解決では、実際のコストよりも回答の品質が重要になります。
Grok 4 Fast Non-Reasoning is the lower-thinking-mode variant of xAI's cost-efficient Grok 4 Fast model.
grok-4-fast-non-reasoning は xAI (US) の 推論 モデルです。 HotON.ai は、2000K トークン コンテキスト ウィンドウを使用して、1M 入力トークンあたり $0.20 および 1M 出力トークンあたり $0.50 で追跡します。複合効率スコアは、成功したタスクごとの推定 $0.001 で 96/100 です。
grok-4-fast-non-reasoning は、1M 入力トークンごとに $0.20 で追跡され、1M 出力トークンごとに $0.50 で追跡されます。一般的な 3:1 の出力と入力のワークロードは、100 万トークンあたりおよそ $0.42 にブレンドされます。図はデモデータの例です。
複雑な推論、分析、計画、および複数のステップからなる問題解決では、実際のコストよりも回答の品質が重要になります。
grok-4-fast-non-reasoning は最大 2000K トークン コンテキスト ウィンドウをサポートします。これは、単一のリクエストで長いドキュメントや長時間の会話を処理するのに十分な大きさです。
HotON.ai 追跡セット内では、grok-4-fast-non-reasoning は入力価格でモデルの 62% より安く、全体的な効率で 521 の #13 にランクされます。
はい — qwen3-30b-a3b-thinking-2507 は、同様の 推論 ユースケースをカバーしながら、1M 出力トークンあたりの $0.40 の低コスト オプションです。 HotON.ai で並べて比較してください。
価格は実際のものです (毎日更新される TestKey カタログ経由)。 LMArena でモデルがランク付けされる品質 (Arena Elo) は本物です。速度、可用性、効率はモデル化された推定値です。