»Et vigtigt wake up call«: ML-forskning koncentrerer sig om enkelte datasæt, som skabes af elite-institutioner

uddannelse ulighed forskning
Illustration: eamesBot, Bigstock. Se større version
Nye datasæt forsømmes til fordel for få klassiske datasæt, der typisk er skabt af AI-miljøets elite, viser forskning. 
7. december 2021 kl. 03:16
errorÆldre end 30 dage

Benchmark-datasæt som ImageNet, MNIST og COCO har haft en afgørende betydning for udvikling af machine learning inden for et væld af opgaver. Men i de seneste års ML-forskning har arbejdet i stigende grad koncentreret sig om færre datasæt, som fortrinsvist er skabt af AI'ens superliga af universiteter og virksomheder. 

Det kan være et problem, mener et forskerhold, som for første gang har forsøgt at kortlægge udvikling i brugen af benchmark-datasæt i ML-forskningen. 

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik. Få tilsendt tilbud

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Log ind for at deltage i den videnskabelige debat.