MiniMax ha rilasciato MSA, un'attenzione sparse costruita sull'Attenzione di Gruppo. Una Ramificazione Indice leggera seleziona i blocchi chiave-valore Top-k per ogni query e gruppo GQA; la Ramificazione Principale presta attenzione solo a quei blocchi. Corrisponde all'Attenzione GQA…
I nuovi modelli ripristinano la frontiera della capacità e del rapporto prezzo-prestazioni. I team rivalutano su cosa costruire ogni volta che un lancio cambia ciò che è possibile fare per ogni dollaro.
I riepiloghi sono aggregati solo a scopo informativo: segui il collegamento alla fonte per la storia completa. Le voci demo sono illustrative.