السعر المختلط اليومي ($/1 مليون) - يتم تسجيله كل يوم، ويتحول إلى اتجاه مع مرور الوقت.
مزيج نموذجي 3:1 من الإخراج إلى الإدخال، لكل مليون رمز
السعر اعتبارًا من 2026-05-11 · مصدر: meta_reference_catalog
أعباء العمل المختلطة للنصوص والصور والصوت والمستندات التي تستفيد من نموذج واحد عبر الطرائق.
Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data. It excels in tasks such as image captioning and...
llama-3.2-11b-vision-instruct هو نموذج متعدد الوسائط من Meta (US). يقوم HotON.ai بتتبعه عند $0.25 لكل 1 مليون رمز إدخال و$0.25 لكل 1 مليون رمز إخراج، مع نافذة سياق رمز 131K. تبلغ درجة كفاءتها المركبة 89/100 بمعدل $0.001 مقدر لكل مهمة ناجحة.
يتم تتبع llama-3.2-11b-vision-instruct عند $0.25 لكل مليون رمز إدخال و$0.25 لكل مليون رمز إخراج. يمتزج عبء عمل الإخراج إلى الإدخال النموذجي بنسبة 3:1 مع $0.25 تقريبًا لكل مليون رمز مميز. الأرقام هي بيانات تجريبية توضيحية.
أعباء العمل المختلطة للنصوص والصور والصوت والمستندات التي تستفيد من نموذج واحد عبر الطرائق.
يدعم llama-3.2-11b-vision-instruct ما يصل إلى نافذة سياق رمز 131K — كبيرة بما يكفي للمستندات الطويلة والمحادثات الموسعة في طلب واحد.
ضمن مجموعة تتبع HotON.ai، تعد llama-3.2-11b-vision-instruct أرخص من نماذج 58% من حيث سعر الإدخال وتصنف #189 من 521 من حيث الكفاءة الإجمالية.
نعم — يعد qwen3.5-flash-02-23 خيارًا أقل تكلفة في $0.26 لكل مليون رمز مميز للمخرج، بينما لا يزال يغطي حالات استخدام متعدد الوسائط مماثلة. قارنهم جنبًا إلى جنب على HotON.ai.
الأسعار حقيقية (عبر كتالوج TestKey، الذي يتم تحديثه يوميًا). الجودة (Arena Elo) حقيقية حيث يتم تصنيف النموذج على LMArena. السرعة والتوافر والكفاءة هي تقديرات نموذجية.