Infraestructura· MarkTechPost· 9 jun 2026· hace 2 meses· Lectura mínima 1

Xiaomi MiMo y TileRT impulsan un modelo de 1 billón de parámetros que supera los 1000 tokens por segundo en GPU comerciales

El equipo MiMo de Xiaomi, con TileRT, lanzó MiMo-V2.5-Pro-UltraSpeed, un modo de servicio para el modelo MiMo-V2.5-Pro. Decodifica más de 1000 tokens por segundo en un modelo de 1 billón de parámetros utilizando un único nodo básico de 8 GPU.…

Por qué es importante

El suministro de computación, la energía y la capacidad de los centros de datos deciden qué tan barato puede funcionar la IA. Los cambios en la infraestructura aparecen en los costos de inferencia semanas después.

Explora en HotON

Empresas y modelos mencionados en esta historia: abra sus páginas y vea los precios en vivo

MIMO-V2.5Xiaomi$0.40 / $2.00entrada / salida · $ por 1 millón de tokens MIMO-V2.5-PROXiaomi$1.00 / $3.00entrada / salida · $ por 1 millón de tokens

Xiaomi →

Explore los datos detrás de esto

Páginas relacionadas con HotON.ai

Regiones →Índices →

Más noticias

Noticias →

Infraestructurahace 5 horas

Las acciones de chips caen a medida que se profundiza la venta masiva de IA

Infraestructurahace 7 horas

Los centros de datos pueden enfrentar cortes de energía temporales para evitar apagones en la red más grande de EE. UU.

Infraestructurahace 10 horas

Taiwán detiene a un empleado de Nvidia por ampliar la investigación sobre contrabando de chips en China

Infraestructurahace 10 horas

Has estado usando mal tu banco de energía y las reglas de las aerolíneas lo hacen obvio

Leer original (MarkTechPost) →

Los resúmenes se agregan únicamente con fines informativos; siga el enlace fuente para ver la historia completa. Las entradas de demostración son ilustrativas.