このラインの追跡バージョン全体で $/1M をブレンドしました。
一般的な 3:1 の出力と入力の組み合わせ (1M トークンあたり)
2026-04-28 時点の価格 · ソース: legacy_model_catalog
混合テキスト、画像、オーディオ、ドキュメントのワークロードでは、複数のモダリティにわたって 1 つのモデルからメリットが得られます。
Qwen3-VL-8B-Instructは、テキスト、画像、ビデオの間で高精度な理解と推論を行うために設計されたマルチモーダルビジョン・ランゲージモデルです。Qwen3-VLシリーズの一員であり、高精度な理解と推論を特徴とします。インタ...
qwen3-vl-32b-instruct は Alibaba Cloud · Qwen (CN) の マルチモーダル モデルです。 HotON.ai は、131K トークン コンテキスト ウィンドウを使用して、1M 入力トークンあたり $0.10 および 1M 出力トークンあたり $0.42 で追跡します。複合効率スコアは、成功したタスクごとの推定 $0.000 で 89/100 です。
qwen3-vl-32b-instruct は、1M 入力トークンごとに $0.10 で追跡され、1M 出力トークンごとに $0.42 で追跡されます。一般的な 3:1 の出力と入力のワークロードは、100 万トークンあたりおよそ $0.34 にブレンドされます。図はデモデータの例です。
混合テキスト、画像、オーディオ、ドキュメントのワークロードでは、複数のモダリティにわたって 1 つのモデルからメリットが得られます。
qwen3-vl-32b-instruct は最大 131K トークン コンテキスト ウィンドウをサポートします。これは、単一のリクエストで長いドキュメントや長時間の会話を処理するのに十分な大きさです。
HotON.ai 追跡セット内では、qwen3-vl-32b-instruct は入力価格でモデルの 78% より安く、全体的な効率で 522 の #144 にランクされます。
はい — gemini-2.5-flash-lite は、同様の マルチモーダル ユースケースをカバーしながら、1M 出力トークンあたりの $0.40 の低コスト オプションです。 HotON.ai で並べて比較してください。
記事、論文、または AI プロンプトに貼り付ける準備ができています。価格と日付はライブ データで更新されます。
HotON.ai — qwen3-vl-32b-instruct (Alibaba Cloud · Qwen): $0.10/1M input, $0.42/1M output, as of 2026-04-28. https://hoton.ai/ja/models/qwen-qwen3-vl-32b-instruct価格は実際のものです (毎日更新される TestKey カタログ経由)。 LMArena でモデルがランク付けされる品質 (Arena Elo) は本物です。速度、可用性、効率はモデル化された推定値です。