MiniMax lanzó MSA, una atención sparse construida sobre Atención de Búsqueda Grupada. Una rama ligera de Índice selecciona bloques clave-valor Top-k por consulta y grupo de GQA; la rama principal solo atiende a esos bloques. Coincide con GQA…
Los nuevos modelos restablecen la frontera entre capacidad y precio-rendimiento. Los equipos reevalúan sobre qué construir cada vez que un lanzamiento cambia lo que es posible por dólar.
Empresas y modelos mencionados en esta historia: abra sus páginas y vea los precios en vivo
Los resúmenes se agregan únicamente con fines informativos; siga el enlace fuente para ver la historia completa. Las entradas de demostración son ilustrativas.