Acompanhe preços de modelos de IA, custos de tokens, tendências de inferência, calor do mercado e sinais de desempenho em toda a economia global de IA.
Os modelos estão mudando. Os preços estão mudando. Os custos de computação estão mudando. HotON.ai transforma sinais fragmentados de IA em inteligência de mercado estruturada.
Desde preços de modelos e tendências de uso até disponibilidade, latência e calor do mercado – toda a economia de IA em uma única tela.
O preço da IA não é mais simples. HotON.ai ajuda construtores, empresas e investidores a entender como os custos do modelo se movem entre fornecedores e categorias.
| Modelo | Região | Entrada | Saída | Ctx |
|---|---|---|---|---|
| GPT-4.1-NANO OpenAI | US | $0.10 | $0.40 | 1048K |
| GEMINI-2.5-FLA Google | US | $0.10 | $0.40 | 1049K |
| MINIMAX-M2.5 MiniMax | CN | $0.12 | $0.99 | 1000K |
| GEMINI-2.5-FLA Google | US | $0.10 | $0.40 | 1049K |
| QWEN-PLUS-2025 Alibaba Cloud · Qwen | CN | $0.26 | $0.78 | 1000K |
| GEMINI-3.1-FLA Google | US | $0.25 | $1.50 | 1049K |
| MINIMAX-01 MiniMax | CN | $0.20 | $1.10 | 1000K |
| LLAMA-4-MAVERI Meta | US | $0.15 | $0.60 | 1049K |
| GPT-4.1-MINI OpenAI | US | $0.40 | $1.60 | 1048K |
| DEEPSEEK Novita AI | US | $0.14 | $0.28 | 1049K |
| GROK-4.1-FAST xAI | US | $0.20 | $0.50 | 2000K |
| GROK-4-1-FAST- xAI | US | $0.20 | $0.50 | 2000K |
| GROK-4-FAST-NO xAI | US | $0.20 | $0.50 | 2000K |
| GROK-4-FAST-RE xAI | US | $0.20 | $0.50 | 2000K |
Benchmarks estruturados para preços de modelos de IA, eficiência, custo de inferência e dinâmica do mercado. As notícias são copiadas – os índices não.
O modelo mais barato nem sempre é o mais eficiente. HotON.ai compara modelos por custo total da tarefa, taxa de sucesso, velocidade, estabilidade e qualidade de saída.
| # | Modelo | Custo/Tarefa | Contexto | Arena Elo | Eficiência |
|---|---|---|---|---|---|
| 01 | GPT-4.1-NANO OpenAI | $0.000 | 1048K | — | 96 |
| 02 | GEMINI-2.5-FLA Google | $0.000 | 1049K | — | 96 |
| 03 | MINIMAX-M2.5 MiniMax | $0.001 | 1000K | — | 96 |
| 04 | GEMINI-2.5-FLA Google | $0.000 | 1049K | — | 96 |
| 05 | QWEN-PLUS-2025 Alibaba Cloud · Qwen | $0.001 | 1000K | — | 96 |
| 06 | GEMINI-3.1-FLA Google | $0.001 | 1049K | — | 96 |
| 07 | MINIMAX-01 MiniMax | $0.001 | 1000K | — | 96 |
Encontre o modelo que realmente oferece o melhor resultado pelo custo. Veja a fronteira completa entre preço e inteligência →
Os custos da IA são moldados por mais do que preços modelo. Região, fornecimento de computação, custo de energia, latência e disponibilidade são importantes.
Mapa ilustrativo das regiões fornecedoras — não um feed ao vivo.
Compare padrões de custos de inferência em regiões globais.
Entenda onde a capacidade da infraestrutura de IA está se tornando mais atraente.
Acompanhe como as condições de energia podem influenciar os preços de computação e inferência.
Descubra quando determinadas regiões podem se tornar mais econômicas para cargas de trabalho de IA.
HotON.ai ajuda o mercado a compreender a geografia dos custos de IA.
Lançamentos de modelos, alterações de preços, mudanças de infraestrutura, atualizações de políticas, eventos de financiamento e movimentos de mercado – filtrados do ruído.
‘Diga a ele que ele é um pedaço de merda’: a nova unidade de IA da Meta é uma bagunça total
Google lança Gemini-SQL2: Gemini 3.1 Pro Text-to-SQL pontua 80,04% no ranking de modelo único BIRD
NVIDIA Blackwell lidera no primeiro benchmark de infraestrutura de IA Agentic
Building Supercharger: Como Rocket Close otimizou as operações de títulos com IA agente
Operação chinesa de crime cibernético que usou IA para enganar ‘centenas de milhares de vítimas’ processadas pelo Google
SpaceX IPO: atualizações ao vivo sobre tudo o que você precisa saber
Aqui está o que a nova startup Prometheus de Jeff Bezos fará
O radar HotON.ai filtra o ruído do mercado de IA e destaca as mudanças que podem afetar custo, acesso, capacidade e concorrência.
Ver tudo →HotON.ai oferece inteligência de mercado na forma de vídeo, recursos visuais e texto. Escolha como você consome a economia da IA — a plataforma lida com todos os formatos.
Uma recapitulação em vídeo de 90 segundos dos maiores movimentos da semana em preços, modelos e infraestrutura de IA.
Assistir recapitulaçãoOnde os custos de insumos e produtos estão aumentando e diminuindo, num piscar de olhos.
A oferta regional de computação diminuiu esta semana, empurrando o Índice de Custo de Inferência para um novo mínimo mensal em três regiões principais…
Showreels, recapitulações e explicadores com reprodução adaptativa.
Gráficos, infográficos e capas, responsivos e nítidos.
Artigos estruturados, resumos e notas de dados.
Inteligência estruturada sobre preços de modelos, infraestrutura de IA, custo de inferência, aquecimento do mercado e tendências globais da cadeia de suprimentos de IA.
Briefings de mercado de IA, relatórios de preços e atualizações de índices — na sua caixa de entrada.
Acesse dados estruturados de mercado de IA por meio de APIs HotON.ai, feeds e produtos de inteligência personalizados.
> GET /v1/models/OPUS-4.8/price { "symbol": "OPUS-4.8", "provider": "Anthropic", "input_per_1m": 6.00, "output_per_1m": 22.50, "context_k": 500, "efficiency": 96, "arena_elo": 1432, "modalities": ["text", "image"] }
HotON.ai é uma plataforma de inteligência de mercado de IA que rastreia preços atuais (atualizados diariamente), custos de token, qualidade (Arena Elo) e tendências de preços de versão para modelos de IA 521 em fornecedores 77 em todo o mundo.
Os preços vêm dos preços oficiais de cada fornecedor (por meio do catálogo TestKey), verificados com OpenRouter e atualizados diariamente. Cada página de modelo mostra a origem do preço e a data “atual”.
Sim. Os preços dos modelos, janelas de contexto, modalidades e pontuações da Arena Elo são reais e fornecidos; a eficiência e o custo por tarefa são calculados a partir desses insumos reais e rotulados como tal.
A partir de 13 de jun. de 2026, o preço combinado mais baixo que rastreamos é $0.01 por 1 milhão de tokens. Veja a classificação completa dos ‘modelos mais baratos’ da lista atual.
Por LMArena Elo de preferência humana, o modelo mais bem avaliado que rastreamos é claude-opus-4.6 (1504). Veja a classificação de qualidade para a tabela de classificação completa.
É uma combinação do preço real e da janela de contexto de um modelo, normalizado para 0-100, de modo que modelos mais baratos e de contexto maior pontuam mais alto. Detalhes completos estão em nossa página Metodologia.
HotON.ai fornece dados, índices e inteligência para entender o próximo passo da economia da IA.