Lancements de modèles· MarkTechPost· 18 juin 2026· il y a 2 heures· Lecture minimale de 1

OpenAI Releases LifeSciBench, a 750-Task Benchmark Grading AI Models on Real Life-Science Research With Expert-Written Rubric

OpenAI's LifeSciBench evaluates whether frontier AI can handle real life-science research across 750 expert-authored tasks, seven workflows, and seven biological domains. Built by 173 PhD scientists with 19,020 rubric c…

Pourquoi c'est important

Les nouveaux modèles repoussent les limites des capacités et du rapport qualité-prix. Les équipes réévaluent les éléments sur lesquels s'appuyer chaque fois qu'un lancement modifie ce qui est possible par dollar.

Explorez sur HotON

Entreprises et modèles mentionnés dans cette histoire — ouvrez leurs pages et prix en direct

OpenAI →

Explorez les données derrière cela

Pages HotON.ai associées

Modèles →Comparer →

Lire l'original (MarkTechPost) →

Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.

Plus de nouvelles

Lancements de modèlesil y a 1 heure

Midjourney Medical goes from generating ‘cat images’ to full-body ultrasound scans

Lancements de modèlesil y a 3 heures

NVIDIA SkillSpector Guide: Scanning AI Skills for Security Risks with Static Analysis and SARIF Reports

Lancements de modèlesil y a 3 heures

How to turn off AI in your Google Docs

Lancements de modèlesil y a 5 heures

Le géant des télécoms coréen au cœur du mythe controversé d'Anthropic