Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.
Mélange sortie-entrée typique 3:1, par million de jetons
Prix à partir du 2026-04-28 · Source: legacy_model_catalog
Raisonnement complexe, analyse, planification et résolution de problèmes en plusieurs étapes où la qualité des réponses compte plus que le coût brut.
DeepSeek R1 Distill Qwen 32B is a distilled large language model based on Qwen 2.5 32B, using outputs from DeepSeek R1. It outperforms OpenAI's o1-mini across various benchmarks, achieving new...
deepseek-r1-distill-qwen-32b est un modèle Raisonnement de DeepSeek (CN). HotON.ai le suit à $0.29 par 1 million de jetons d'entrée et $0.29 par 1 million de jetons de sortie, avec une fenêtre contextuelle de jeton 33K. Son score d'efficacité composite est de 88/100 avec une estimation de $0.001 par tâche réussie.
deepseek-r1-distill-qwen-32b est suivi à $0.29 par 1 million de jetons d'entrée et à $0.29 par 1 million de jetons de sortie. Une charge de travail typique de 3:1 sortie-entrée se mélange à environ $0.29 pour 1 million de jetons. Les chiffres sont des données de démonstration illustratives.
Raisonnement complexe, analyse, planification et résolution de problèmes en plusieurs étapes où la qualité des réponses compte plus que le coût brut.
deepseek-r1-distill-qwen-32b prend en charge jusqu'à une fenêtre contextuelle de jeton 33K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.
Dans l'ensemble suivi HotON.ai, deepseek-r1-distill-qwen-32b est moins cher que 55% des modèles en termes de prix d'entrée et se classe #296 de 521 en termes d'efficacité globale.
Oui — qwen3-30b-a3b-thinking-2507 est une option moins coûteuse à $0.40 par 1 million de jetons de sortie, tout en couvrant des cas d'utilisation similaires de Raisonnement. Comparez-les côte à côte sur HotON.ai.
Le prix est réel (via le catalogue TestKey, mis à jour quotidiennement). La qualité (Arena Elo) est réelle là où le modèle est classé sur LMArena. La vitesse, la disponibilité et l'efficacité sont des estimations modélisées.