Portchain bruger NLP til at tiltrække alsidige data-kandidater: »Vi tiltrækker folk, der ligner os selv«

sprog nlp
Illustration: designer491, bigstock. Se større version
Mangel på diversitet i data science bliver i Danmark ikke anerkendt som et problem, men det skal adresseres, siger Maria Ovchinnikova. 
Interview23. februar 2021 kl. 04:26
errorÆldre end 30 dage

Forestil dig, at du har trænet en model til ansigtsgenkendelse fra bunden. Hvem er den første, du tester den på?

Maria Ovchinnikova, data scientist og product owner ved PortChain, er ikke i tvivl; Det første, du gør, er at teste den på dig selv. Derefter på en kollega, og hvem der ellers lige er til stede på kontoret. 

»Og nu har du allerede en idé om, om din model er god.«

Det simple eksempel illustrerer en pointe, som AI-feltet har demonstreret igen og igen  med datasæt, der rummer nedsættende tags om kvinder og minoriteter, rekrutteringsmodeller, der foretrække mænd, eller sprogmodeller, der sammenkobler islam med terrorisme: Vi har en tendens til at skabe teknologi, der fungerer for os selv og dem, der ligner os. Og derfor har data science hårdt brug for diversitet. 

»Et alsidigt team kommer med meget mere indsigt og flere holdninger. Det giver dig perspektiver på, hvordan du kan træne på data, og hvordan du kan dække alle de forskellige use cases,« forklarer Maria Ovchinnikova. 

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik. Få tilsendt tilbud

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Log ind for at deltage i den videnskabelige debat.