毎日の混合価格 ($/100 万) — 毎日記録され、時間の経過とともにトレンドが形成されます。
一般的な 3:1 の出力と入力の組み合わせ (1M トークンあたり)
2026-05-11 時点の価格 · ソース: meta_reference_catalog
混合テキスト、画像、オーディオ、ドキュメントのワークロードでは、複数のモダリティにわたって 1 つのモデルからメリットが得られます。
Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...
llama-4-scout は Meta (US) の マルチモーダル モデルです。 HotON.ai は、328K トークン コンテキスト ウィンドウを使用して、1M 入力トークンあたり $0.08 および 1M 出力トークンあたり $0.30 で追跡します。複合効率スコアは、成功したタスクごとの推定 $0.000 で 91/100 です。
llama-4-scout は、1M 入力トークンごとに $0.08 で追跡され、1M 出力トークンごとに $0.30 で追跡されます。一般的な 3:1 の出力と入力のワークロードは、100 万トークンあたりおよそ $0.24 にブレンドされます。図はデモデータの例です。
混合テキスト、画像、オーディオ、ドキュメントのワークロードでは、複数のモダリティにわたって 1 つのモデルからメリットが得られます。
llama-4-scout は最大 328K トークン コンテキスト ウィンドウをサポートします。これは、単一のリクエストで長いドキュメントや長時間の会話を処理するのに十分な大きさです。
HotON.ai 追跡セット内では、llama-4-scout は入力価格でモデルの 85% より安く、全体的な効率で 521 の #62 にランクされます。
はい — qwen3.5-flash-02-23 は、同様の マルチモーダル ユースケースをカバーしながら、1M 出力トークンあたりの $0.26 の低コスト オプションです。 HotON.ai で並べて比較してください。
価格は実際のものです (毎日更新される TestKey カタログ経由)。 LMArena でモデルがランク付けされる品質 (Arena Elo) は本物です。速度、可用性、効率はモデル化された推定値です。