Infrastruktur· MarkTechPost· 9. Juni 2026· vor 2 Monaten· 1 Min. Lesezeit

Xiaomi MiMo und TileRT bringen ein 1-Billion-Parameter-Modell auf Standard-GPUs auf über 1000 Token pro Sekunde

Das MiMo-Team von Xiaomi hat mit TileRT MiMo-V2.5-Pro-UltraSpeed veröffentlicht, einen Serviermodus für das MiMo-V2.5-Pro-Modell. Es dekodiert über 1000 Token pro Sekunde auf einem 1-Billion-Parameter-Modell unter Verwendung eines einzigen 8-GPU-Commodity-Knotens.…

Warum es wichtig ist

Rechenleistung, Energie und Rechenzentrumskapazität entscheiden darüber, wie kostengünstig KI betrieben werden kann. Infrastrukturverschiebungen zeigen sich Wochen später in den Inferenzkosten.

Entdecken Sie auf HotON

In dieser Geschichte erwähnte Unternehmen und Modelle – öffnen Sie ihre Seiten und sehen Sie die aktuellen Preise

MIMO-V2.5Xiaomi$0.40 / $2.00rein/aus · $ pro 1 Mio. Token MIMO-V2.5-PROXiaomi$1.00 / $3.00rein/aus · $ pro 1 Mio. Token

Xiaomi →

Entdecken Sie die Daten dahinter

Verwandte HotON.ai-Seiten

Regionen →Indizes →

Weitere Neuigkeiten

Nachricht →

Infrastrukturvor 6 Stunden

Chip-Aktien fallen, da der KI-Ausverkauf zunimmt

Infrastrukturvor 8 Stunden

Rechenzentren könnten mit vorübergehenden Stromausfällen rechnen, um Stromausfälle im größten US-Netz zu verhindern

Infrastrukturvor 11 Stunden

Taiwan nimmt Nvidia-Mitarbeiter fest, weil Ermittlungen zum Chipschmuggel in China ausgeweitet werden

Infrastrukturvor 11 Stunden

Sie haben Ihre Powerbank falsch verwendet, und die Regeln der Fluggesellschaft machen das offensichtlich

Original lesen (MarkTechPost) →

Zusammenfassungen werden nur zu Informationszwecken aggregiert – folgen Sie dem Quelllink für die vollständige Geschichte. Demo-Einträge dienen der Veranschaulichung.