MiniMax merilis MSA, sebuah attention spars yang dibangun di atas Grouped Query Attention. Cabang Indeks memilih blok top-k key-value per query dan GQA group; cabang utama hanya mendengar blok-blok itu. Itu cocok dengan GQA…
Model-model baru mengatur ulang batas kemampuan dan harga-kinerja. Tim mengevaluasi kembali apa yang harus dikembangkan setiap kali peluncuran mengubah apa yang mungkin dilakukan per dolar.
Ringkasan dikumpulkan untuk informasi saja — ikuti tautan sumber untuk cerita selengkapnya. Entri demo bersifat ilustratif.