تم مزج $/1M عبر الإصدارات المتعقبة من هذا الخط.
مزيج نموذجي 3:1 من الإخراج إلى الإدخال، لكل مليون رمز
السعر اعتبارًا من 2026-04-28 · مصدر: legacy_model_catalog
أعباء العمل المختلطة للنصوص والصور والصوت والمستندات التي تستفيد من نموذج واحد عبر الطرائق.
Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perce...
qwen3-vl-32b-instruct هو نموذج متعدد الوسائط من Alibaba Cloud · Qwen (CN). يقوم HotON.ai بتتبعه عند $0.10 لكل 1 مليون رمز إدخال و$0.42 لكل 1 مليون رمز إخراج، مع نافذة سياق رمز 131K. تبلغ درجة كفاءتها المركبة 89/100 بمعدل $0.000 مقدر لكل مهمة ناجحة.
يتم تتبع qwen3-vl-32b-instruct عند $0.10 لكل مليون رمز إدخال و$0.42 لكل مليون رمز إخراج. يمتزج عبء عمل الإخراج إلى الإدخال النموذجي بنسبة 3:1 مع $0.34 تقريبًا لكل مليون رمز مميز. الأرقام هي بيانات تجريبية توضيحية.
أعباء العمل المختلطة للنصوص والصور والصوت والمستندات التي تستفيد من نموذج واحد عبر الطرائق.
يدعم qwen3-vl-32b-instruct ما يصل إلى نافذة سياق رمز 131K — كبيرة بما يكفي للمستندات الطويلة والمحادثات الموسعة في طلب واحد.
ضمن مجموعة تتبع HotON.ai، تعد qwen3-vl-32b-instruct أرخص من نماذج 78% من حيث سعر الإدخال وتصنف #235 من 521 من حيث الكفاءة الإجمالية.
نعم — يعد gpt-4.1-nano خيارًا أقل تكلفة في $0.40 لكل مليون رمز مميز للمخرج، بينما لا يزال يغطي حالات استخدام متعدد الوسائط مماثلة. قارنهم جنبًا إلى جنب على HotON.ai.
الأسعار حقيقية (عبر كتالوج TestKey، الذي يتم تحديثه يوميًا). الجودة (Arena Elo) حقيقية حيث يتم تصنيف النموذج على LMArena. السرعة والتوافر والكفاءة هي تقديرات نموذجية.