السعر المختلط اليومي ($/1 مليون) - يتم تسجيله كل يوم، ويتحول إلى اتجاه مع مرور الوقت.
مزيج نموذجي 3:1 من الإخراج إلى الإدخال، لكل مليون رمز
مصدر: litellm
أعباء العمل المختلطة للنصوص والصور والصوت والمستندات التي تستفيد من نموذج واحد عبر الطرائق.
Alpindale Llama 3.2 11B Vision Instruct is a vision-language model card for image understanding supplier prefill.
Llama-3.2-11B-Vision-Instruct هو نموذج متعدد الوسائط من Alpindale (US). يقوم HotON.ai بتتبعه عند $0.37 لكل 1 مليون رمز إدخال و$0.37 لكل 1 مليون رمز إخراج، مع نافذة سياق رمز 131K. تبلغ درجة كفاءتها المركبة 89/100 بمعدل $0.001 مقدر لكل مهمة ناجحة.
يتم تتبع Llama-3.2-11B-Vision-Instruct عند $0.37 لكل مليون رمز إدخال و$0.37 لكل مليون رمز إخراج. يمتزج عبء عمل الإخراج إلى الإدخال النموذجي بنسبة 3:1 مع $0.37 تقريبًا لكل مليون رمز مميز. الأرقام هي بيانات تجريبية توضيحية.
أعباء العمل المختلطة للنصوص والصور والصوت والمستندات التي تستفيد من نموذج واحد عبر الطرائق.
يدعم Llama-3.2-11B-Vision-Instruct ما يصل إلى نافذة سياق رمز 131K — كبيرة بما يكفي للمستندات الطويلة والمحادثات الموسعة في طلب واحد.
ضمن مجموعة تتبع HotON.ai، تعد Llama-3.2-11B-Vision-Instruct أرخص من نماذج 49% من حيث سعر الإدخال وتصنف #237 من 521 من حيث الكفاءة الإجمالية.
نعم — يعد gpt-4.1-nano خيارًا أقل تكلفة في $0.40 لكل مليون رمز مميز للمخرج، بينما لا يزال يغطي حالات استخدام متعدد الوسائط مماثلة. قارنهم جنبًا إلى جنب على HotON.ai.
الأسعار حقيقية (عبر كتالوج TestKey، الذي يتم تحديثه يوميًا). الجودة (Arena Elo) حقيقية حيث يتم تصنيف النموذج على LMArena. السرعة والتوافر والكفاءة هي تقديرات نموذجية.