Infraestrutura· MarkTechPost· 9 de jun. de 2026· há 2 meses· 1 min lido

Xiaomi MiMo e TileRT impulsionam um modelo de 1 trilhão de parâmetros além de 1.000 tokens por segundo em GPUs de commodities

A equipe MiMo da Xiaomi, com TileRT, lançou o MiMo-V2.5-Pro-UltraSpeed, um modo de serviço para o modelo MiMo-V2.5-Pro. Ele decodifica mais de 1.000 tokens por segundo em um modelo de 1 trilhão de parâmetros usando um único nó de commodity de 8 GPU.…

Por que isso importa

O fornecimento de computação, a energia e a capacidade do data center decidem o quão barato a IA pode funcionar. As mudanças na infraestrutura aparecem nos custos de inferência semanas depois.

Explorar em HotON

Empresas e modelos mencionados nesta história – abra suas páginas e preços ao vivo

MIMO-V2.5Xiaomi$0.40 / $2.00entrada/saída · $ por 1 milhão de tokens MIMO-V2.5-PROXiaomi$1.00 / $3.00entrada/saída · $ por 1 milhão de tokens

Xiaomi →

Explore os dados por trás disso

Páginas HotON.ai relacionadas

Regiões →Índices →

Mais notícias

Notícias →

Infraestruturahá 4 horas

NVIDIA aproveita a CPU Vera para acelerar o design de CPUs e GPUs de próxima geração

Infraestruturahá 9 horas

Entendendo o pânico em relação à IA chinesa

Infraestruturaontem

Projetando kernels de GPU de alto desempenho com TileLang: Tensor-Core GEMM, Fused Softmax, FlashAttention e Autotuning

Infraestruturaanteontem

Uma linha de energia caída expôs um problema crescente no data center de IA. Veja como consertar isso.

Leia o original (MarkTechPost) →

Os resumos são agregados apenas para fins informativos – siga o link da fonte para ver a história completa. As entradas de demonstração são ilustrativas.