USTexteLLAMA-3.1-8B-I En direct · mis à jour quotidiennement

llama-3.1-8b-instant

Groq

Score d'efficacité

89/100

Prix d'entrée

$0.05/ 1 million de jetons

Prix de sortie

$0.08/ 1 million de jetons

Fenêtre contextuelle

131K

Prix mixte

$0.07/ 1 million de jetons

Coût / tâche

$0.000

Alerte baisse de prix

Recevez un e-mail lorsque le prix mixte de ce modèle baisse. Aucun compte requis.

Un e-mail par dépôt. Désabonnez-vous à tout moment.

Capacités

Accepte (saisie)

Texte

Produit (sortie)

Texte

Prix au fil du temps

Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.

Répartition des prix

Prix d'entrée

$0.05/ 1 million de jetons

$0.0001 / 1K

Prix de sortie

$0.08/ 1 million de jetons

$0.0001 / 1K

Prix mixte

$0.07/ 1 million de jetons

$0.0001 / 1K

Mélange sortie-entrée typique 3:1, par million de jetons

Prix à partir du 2026-05-10 · Source: groq_official_pricing

Coût mensuel estimé par charge de travail

Assistant de discussion

$24.60/ mois

1 000 entrées · 400 sorties · 10 000 demandes/jour

RAG / contexte long

$67.20/ mois

8K en entrée · 600 en sortie · 5K demande/jour

Utilisation des agents/outils

$64.80/ mois

3K en entrée · 1,5K en sortie · 8K demande/jour

Estimez votre coût →

Position sur le marché

Moins cher que 91% des modèles suivis
Contexte plus large que 39% des modèles suivis
Classement d'efficacité: #293 de 535

Idéal pour

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

À propos de llama-3.1-8b-instant

Llama 3.1 8B hébergé par Groq optimisé pour une génération de texte à faible latence et haut débit.

llama-3.1-8b-instant est un modèle Texte de Groq (US). HotON.ai le suit à $0.05 par 1 million de jetons d'entrée et $0.08 par 1 million de jetons de sortie, avec une fenêtre contextuelle de jeton 131K. Son score d'efficacité composite est de 89/100 avec une estimation de $0.000 par tâche réussie.

Comparez llama-3.1-8b-instant

LLAMA-3.1-8B-I vs MERCURY-2-INST LLAMA-3.1-8B-I vs MORPH-RERANK-V LLAMA-3.1-8B-I vs VIRTUOSO-LARGE LLAMA-3.1-8B-I vs CYDONIA-24B-V4

Actualités du marché liées

Le paradoxe du tuteur en matière de codage de l’IA s’accentue à mesure que les enseignants s’efforcent de repenser la façon dont ils testent les compétences réellesil y a 3 heures Monday.com est la dernière entreprise technologique à blâmer AI pour les licenciements – en voici 20 autresil y a 9 heures Sakana AI lance Fugu-Cyber : un modèle d'orchestration rapportant 86,9 % sur CyberGym et 72,1 % sur CTI-REALMil y a 10 heures

Questions fréquemment posées

Combien coûte llama-3.1-8b-instant pour 1 million de jetons ?+

llama-3.1-8b-instant est suivi à $0.05 par 1 million de jetons d'entrée et à $0.08 par 1 million de jetons de sortie. Une charge de travail typique de 3:1 sortie-entrée se mélange à environ $0.07 pour 1 million de jetons. Les chiffres sont des données de démonstration illustratives.

À quoi sert llama-3.1-8b-instant ?+

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

Quelle est la taille de la fenêtre contextuelle de llama-3.1-8b-instant ?+

llama-3.1-8b-instant prend en charge jusqu'à une fenêtre contextuelle de jeton 131K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.

Le llama-3.1-8b-instant est-il moins cher que les autres modèles d’IA ?+

Dans l'ensemble suivi HotON.ai, llama-3.1-8b-instant est moins cher que 91% des modèles en termes de prix d'entrée et se classe #293 de 535 en termes d'efficacité globale.

Existe-t-il une alternative moins chère au llama-3.1-8b-instant ?+

Oui — morph-rerank-v3 est une option moins coûteuse à $0.00 par 1 million de jetons de sortie, tout en couvrant des cas d'utilisation similaires de Texte. Comparez-les côte à côte sur HotON.ai.

Citer ce modèle

Prêt à coller dans des articles, des articles ou des invites d'IA : les prix et la date sont actualisés avec les données en direct.

HotON.ai — llama-3.1-8b-instant (Groq): $0.05/1M input, $0.08/1M output, as of 2026-05-10. https://hoton.ai/fr/models/groq-llama-3-1-8b-instant

Modèles associés

Le prix est réel (via le catalogue TestKey, mis à jour quotidiennement). La qualité (Arena Elo) est réelle là où le modèle est classé sur LMArena. L’efficacité est un composite modélisé du prix réel et du contexte.

Prix au fil du temps

Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.

Répartition des prix

Prix d'entrée

$0.05/ 1 million de jetons

$0.0001 / 1K

Prix de sortie

$0.08/ 1 million de jetons

$0.0001 / 1K

Prix mixte

$0.07/ 1 million de jetons

$0.0001 / 1K

Mélange sortie-entrée typique 3:1, par million de jetons

Prix à partir du 2026-05-10 · Source: groq_official_pricing

Coût mensuel estimé par charge de travail

Assistant de discussion

$24.60/ mois

1 000 entrées · 400 sorties · 10 000 demandes/jour

RAG / contexte long

$67.20/ mois

8K en entrée · 600 en sortie · 5K demande/jour

Utilisation des agents/outils

$64.80/ mois

3K en entrée · 1,5K en sortie · 8K demande/jour

Estimez votre coût →

Idéal pour

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

À propos de llama-3.1-8b-instant

Llama 3.1 8B hébergé par Groq optimisé pour une génération de texte à faible latence et haut débit.

Questions fréquemment posées

Combien coûte llama-3.1-8b-instant pour 1 million de jetons ?+

À quoi sert llama-3.1-8b-instant ?+

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

Quelle est la taille de la fenêtre contextuelle de llama-3.1-8b-instant ?+

llama-3.1-8b-instant prend en charge jusqu'à une fenêtre contextuelle de jeton 131K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.

Le llama-3.1-8b-instant est-il moins cher que les autres modèles d’IA ?+

Dans l'ensemble suivi HotON.ai, llama-3.1-8b-instant est moins cher que 91% des modèles en termes de prix d'entrée et se classe #293 de 535 en termes d'efficacité globale.

Existe-t-il une alternative moins chère au llama-3.1-8b-instant ?+

llama-3.1-8b-instant

Capacités

Prix ​​au fil du temps

Répartition des prix

Coût mensuel estimé par charge de travail

Position sur le marché

Idéal pour

À propos de llama-3.1-8b-instant

Comparez llama-3.1-8b-instant

Actualités du marché liées

Questions fréquemment posées

Citer ce modèle

Modèles associés

llama-3.1-8b-instant

Capacités

Prix ​​au fil du temps

Répartition des prix

Coût mensuel estimé par charge de travail

Position sur le marché

Idéal pour

À propos de llama-3.1-8b-instant

Comparez llama-3.1-8b-instant

Actualités du marché liées

Questions fréquemment posées

Citer ce modèle

Modèles associés

Prix au fil du temps

Prix au fil du temps