Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.
Mélange sortie-entrée typique 3:1, par million de jetons
Prix à partir du 2026-05-10 · Source: baidu_qianfan_official_pricing
Charges de travail mixtes de texte, d'image, d'audio et de documents qui bénéficient d'un modèle unique pour toutes les modalités.
A powerful multimodal Mixture-of-Experts chat model featuring 28B total parameters with 3B activated per token, delivering exceptional text and vision understanding through its innovative heterogeneous MoE structure w...
ernie-4.5-vl-28b-a3b est un modèle Multimodal de Baidu Wenxin (CN). HotON.ai le suit à $0.14 par 1 million de jetons d'entrée et $0.56 par 1 million de jetons de sortie, avec une fenêtre contextuelle de jeton 66K. Son score d'efficacité composite est de 89/100 avec une estimation de $0.001 par tâche réussie.
ernie-4.5-vl-28b-a3b est suivi à $0.14 par 1 million de jetons d'entrée et à $0.56 par 1 million de jetons de sortie. Une charge de travail typique de 3:1 sortie-entrée se mélange à environ $0.46 pour 1 million de jetons. Les chiffres sont des données de démonstration illustratives.
Charges de travail mixtes de texte, d'image, d'audio et de documents qui bénéficient d'un modèle unique pour toutes les modalités.
ernie-4.5-vl-28b-a3b prend en charge jusqu'à une fenêtre contextuelle de jeton 66K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.
Dans l'ensemble suivi HotON.ai, ernie-4.5-vl-28b-a3b est moins cher que 73% des modèles en termes de prix d'entrée et se classe #236 de 521 en termes d'efficacité globale.
Oui — gpt-4.1-nano est une option moins coûteuse à $0.40 par 1 million de jetons de sortie, tout en couvrant des cas d'utilisation similaires de Multimodal. Comparez-les côte à côte sur HotON.ai.
Le prix est réel (via le catalogue TestKey, mis à jour quotidiennement). La qualité (Arena Elo) est réelle là où le modèle est classé sur LMArena. La vitesse, la disponibilité et l'efficacité sont des estimations modélisées.