Présentation de LifeSciBench, un point de référence rédigé et examiné par des experts pour évaluer la manière dont les systèmes d'IA gèrent les tâches et les décisions de recherche en sciences de la vie réelles.
Les nouveaux modèles repoussent les limites des capacités et du rapport qualité-prix. Les équipes réévaluent les éléments sur lesquels s'appuyer chaque fois qu'un lancement modifie ce qui est possible par dollar.
Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.