Deep learning skævvrider data. Nu har DTU-forskere gjort det muligt at måle

Hvordan verden ikke ser ud. Mercator-projektionen skævvrider landmasser for at gøre kloden flad, og det samme kan et neural netværk komme til, når det komprimerer data.
Hvordan verden ikke ser ud. Mercator-projektionen skævvrider landmasser for at gøre kloden flad, og det samme kan et neural netværk komme til, når det komprimerer data. Illustration: PyTY, Bigstock. Se større version
Når deep learning reducerer dimensioner i et datasæt kan der opstå logiske brister, som i sidste ende kan lede til forkerte beslutninger.
Tech fokus 30. september kl. 03:14
errorÆldre end 30 dage

Det er ikke til at se, hvis man kigger på Mercators version af et verdenskort, at Afrika er 14 gange større end Grønland. I processen med at gøre globen flad nok til at kunne indgå i et atlas har den flamske kartograf vredet klodens landmasser helt ud af proportioner.

Matematisk set er det den samme skævvridning, der foregår når et neuralt netværk forsøger at finde en komprimeret måde at repræsentere data på. Og det har længe været et problem inden for unsupervised learning, forklarer Søren Hauberg, der er professor ved DTU Compute. 

»Du tager noget som er 3-dimensionelt, og laver det om til et landkort, som er 2-dimensionelt. Når du gør det, introducerer du fejl,« siger han. 

»Det er præcis den samme ting som foregår i det neurale netværk, når det reducerer dimensioner i data, Og det betyder, at der kan opstå logiske brister.«

Ligesom det kræver en navigatør at styre gennem virkeligheden på baggrund af et kort, så kræver det forståelse for de skævvridninger, hvis man skal lave et realitetstjek på de sammenhænge, det neurale netværk finder i data. Det værktøj har DTU-forskerne nu udviklet. 

»Vi prøver at gå baglæns gennem det neurale netværk for at forstå, hvordan den kompakte repræsentation af data er lavet,« forklarer Søren Hauberg. 

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik.

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Du har ikke tilladelse til at deltage i debatten. Kontakt support@ing.dk hvis du mener at dette er en fejl.
Forsiden