Preço combinado diário (US$/1 milhão) — registrado todos os dias, cria uma tendência ao longo do tempo.
Mix típico de saída para entrada de 3:1, por 1 milhão de tokens
Fonte: litellm
Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.
Moonshot V1 32K is a mid-context Moonshot generation model for longer chat and document workloads.
moonshot-v1-32k é um modelo Texto da Moonshot / Kimi (CN). HotON.ai o rastreia em $1.00 por 1 milhão de tokens de entrada e $3.00 por 1 milhão de tokens de saída, com uma janela de contexto de token 33K. Sua pontuação de eficiência composta é 87/100 com um $0.004 estimado por tarefa bem-sucedida.
moonshot-v1-32k é rastreado em $1.00 por 1 milhão de tokens de entrada e $3.00 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $2.50 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.
Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.
moonshot-v1-32k suporta até uma janela de contexto de token 33K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.
Dentro do conjunto rastreado HotON.ai, moonshot-v1-32k é mais barato que 27% dos modelos no preço de entrada e classifica #426 de 521 em termos de eficiência geral.
Sim – minimax-m2.5 é uma opção de custo mais baixo em $0.99 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Texto. Compare-os lado a lado no HotON.ai.
O preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.