OpenAI'nin LifeSciBench, öncü AI'nin 750 uzman tarafından yazılmış görevler, yedi iş akışı ve yedi biyolojik alanda gerçek yaş bilim araştırmasıyla başa çıkıp çıkmadığını değerlendirir. 173 PhD bilim insanı tarafından 19,020 rubrik ile inşa edilmiştir.
Yeni modeller kapasite ve fiyat-performans sınırını sıfırlıyor. Ekipler, bir lansman dolar başına mümkün olanı değiştirdiğinde neyin üzerine inşa edileceklerini yeniden değerlendiriyor.
Özetler yalnızca bilgi amaçlı olarak toplanmıştır; hikayenin tamamı için kaynak bağlantısını takip edin. Demo girişleri örnek niteliğindedir.