Le cache KV dépasse maintenant les poids des modèles dans un contexte long. Voici comment TurboQuant, OSCAR et EpiCache attaquent chacun ce goulet d'étranglement mémoire — et pourquoi ils sont plus complémentaires que concurrentiels. L'article Le Concours de Compression de Cache KV Compre…
Les nouveaux modèles repoussent les limites des capacités et du rapport qualité-prix. Les équipes réévaluent les éléments sur lesquels s'appuyer chaque fois qu'un lancement modifie ce qui est possible par dollar.
Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.