このラインの追跡バージョン全体で $/1M をブレンドしました。
一般的な 3:1 の出力と入力の組み合わせ (1M トークンあたり)
2026-05-11 時点の価格 · ソース: meta_reference_catalog
幅広い機能と低コストが最も重要な汎用テキスト生成、チャット、要約、およびコンテンツのワークロード。
Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors. This 8B instruct-tuned version is fast and efficient. It has demonstrated strong performance compared to...
llama-3.1-8b-instruct は Meta (US) の 文章 モデルです。 HotON.ai は、16K トークン コンテキスト ウィンドウを使用して、1M 入力トークンあたり $0.02 および 1M 出力トークンあたり $0.05 で追跡します。複合効率スコアは、成功したタスクごとの推定 $0.000 で 88/100 です。
llama-3.1-8b-instruct は、1M 入力トークンごとに $0.02 で追跡され、1M 出力トークンごとに $0.05 で追跡されます。一般的な 3:1 の出力と入力のワークロードは、100 万トークンあたりおよそ $0.04 にブレンドされます。図はデモデータの例です。
幅広い機能と低コストが最も重要な汎用テキスト生成、チャット、要約、およびコンテンツのワークロード。
llama-3.1-8b-instruct は最大 16K トークン コンテキスト ウィンドウをサポートします。これは、単一のリクエストで長いドキュメントや長時間の会話を処理するのに十分な大きさです。
HotON.ai 追跡セット内では、llama-3.1-8b-instruct は入力価格でモデルの 97% より安く、全体的な効率で 521 の #345 にランクされます。
はい — gemma-3n-e4b-it は、同様の 文章 ユースケースをカバーしながら、1M 出力トークンあたりの $0.04 の低コスト オプションです。 HotON.ai で並べて比較してください。
価格は実際のものです (毎日更新される TestKey カタログ経由)。 LMArena でモデルがランク付けされる品質 (Arena Elo) は本物です。速度、可用性、効率はモデル化された推定値です。