MiniMaxは、Grouped Query Attentionに基づいた稀疏な注意を構築したMSAをリリースしました。軽量なIndex Branchは、各クエリとGQAグループごとにTop-kのキー-バリューブロックを選択し、Main Branchはそれらのブロックのみに注意を払います。それがGQAと一致します…
新しいモデルは、機能と価格パフォーマンスの最前線をリセットします。チームは、ローンチによって 1 ドルあたりの可能性が変わるたびに、何を構築するかを再評価します。
概要は情報提供のみを目的としてまとめられています。全文についてはソース リンクを参照してください。デモのエントリは一例です。