Infrastruttura· MarkTechPost· 9 giu 2026· 2 mesi fa· 1 lettura minima

Xiaomi MiMo e TileRT spingono un modello da 1 trilione di parametri oltre i 1000 token al secondo sulle GPU Commodity

Il team MiMo di Xiaomi, con TileRT, ha rilasciato MiMo-V2.5-Pro-UltraSpeed, una modalità di servizio per il modello MiMo-V2.5-Pro. Decodifica oltre 1000 token al secondo su un modello da 1 trilione di parametri utilizzando un singolo nodo merceologico da 8 GPU.…

Perché è importante

L’offerta di elaborazione, l’energia e la capacità dei data center determinano quanto a buon mercato può funzionare l’intelligenza artificiale. I cambiamenti infrastrutturali si manifestano nei costi di inferenza settimane dopo.