Introduzindo LifeSciBench, um benchmark revisado por especialistas e escrito por especialistas para avaliar como sistemas de IA lidam com tarefas e decisões de pesquisa em ciências da vida do mundo real.
Novos modelos redefinem a fronteira de capacidade e preço-desempenho. As equipes reavaliam o que desenvolver sempre que um lançamento muda o que é possível por dólar.
Os resumos são agregados apenas para fins informativos – siga o link da fonte para ver a história completa. As entradas de demonstração são ilustrativas.