Syntetiske data skal hjælpe frustrerede forskere med privacy og datadeling

Henning Langberg, Rigshospitalet og Thor Hvidbak, Deloitte
Henning Langberg (tv.) fra Rigshospitalet og Thor Hvidbak fra Deloitte talte om syntetiske data på konferencen Offdig, der blev afholdt i Aarhus for nyligt. Illustration: Tania Andersen.
Tiden er kommet for fiktive data, der kan løse problemer med persondata, privacy og datadeling på tværs af grænser. Det kan give virksomheder og ph.d'er nemmere muligheder end med de ægte data.
5. april kl. 05:00
errorÆldre end 30 dage

Syntetiske data kan i hvert fald et stykke af vejen løse privacy-problemer med persondata i forskningsmæssige sammenhænge. Det mener Thor Hvidbak, som er konsulent i Deloitte og tidligere chef for informationssikkerhed i Region Hovedstaden, og Henning Langberg, innovationschef på Rigshospitalet.

På den nyligt afholdte Offdig-konference gav Henning Langberg et eksempel, hvor machine learning i forbindelse med screening for brystkræft sparer Rigshospitalet for en radiolog.

Et andet eksempel er scanninger af børn eller urolige voksne, hvis bevægelser under en scanning resulterer i uskarpe billeder. Her kan en algoritme gøre de slørede billeder skarpe igen, så patienterne slipper for ubehagelig bedøvelse, der ellers måtte i anvendelse.

Det hele kræver data, som er personfølsomme, og som derfor skal behandles med varsomhed i overensstemmelse med love og regler.

Det er almindelig kendt, at sundhedsforskere i Danmark føler, at de drukner i papirarbejde og juristeri. 

»Vi har et akut problem, som truer vores ambitioner om at løfte dansk life science op i verdensklasse. Vi har kapaciteten til at lave meget mere forskning. Men det strander i øjeblikket i papirarbejde og ventetider,« har formanden for lægeforeningens forskningsudvalg, Sanne Thysen, tidligere udtalt til Ingeniøren.

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik. Få tilsendt tilbud

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Log ind for at deltage i debatten.
settingsDebatindstillinger
6
3. april kl. 17:43

Det holdt hårdt.

Men #5 fik vist at fravær af (ekstra) tryk på udgiv ikke giver flere ens indlæg.

Rettelse:

Som man kunne forvente giver fravær af 'Forhåmdsvisning' og mulighed "vindue" for rettelser af indlæg flere utilsiftede fejl i indlæg. Her:

Ref: MIT Kusus 6.172 på Open Course Ware (OCW.MIT.EDU).

Skulle have læst:

Ref: MIT Kursus 6.172 på Open Course Ware (OCW.MIT.EDU).

5
3. april kl. 17:29

Debatsystemet Re: #1

Det er faktisk et lille farveskift i den grønne 'Udgiv'-knap, men om det er nok? Hypotese: Tryk på knappen efter farveskift giver ens indlæg.

Syntetiske datasæt SD

Hvis man set bort fra de udfordringer (problemer), der kan ligge i at generere disse datasæt, synes jeg. det (SD) vil være et nyttigt redskab for udviklere af algoritmer. Man kan luge fejl ud i algoritmer og sikkerhed, samt eftervise "yde-evne" uden risici.

Intel MKL (Math Kernel Library) er et eksempel på "forbedring" af yde-evne, som kan bringe fx matrix-multiplikation op på ca 45% (af teoretisk maximum), hvor utraditionelle metoder som transposition "kun" kan nå op på knap 40%.

Ref: MIT Kusus 6.172 på Open Course Ware (OCW.MIT.EDU).

4
1. april kl. 12:46

Beklager triplepost. Der var ingen feedback overhovedet på tryk på "Udgiv"-knappen.

3
1. april kl. 12:45

Det er jo tegn på et dårligt fungerende system.

Der er sjældent folk i disse komiteer, som ikke har en personlig interesse i at give adgang til data.

Problemet er vel i bund og grund at man netop deler data ud til hvem som helst, der gider at udfylde ansøgningen korrekt. Det klassiske DJØF-svar er jo, også her, øget bureaukratisering.

Hvorfor ikke rent faktisk sætte nogle folk i komiteerne, til at varetage patienternes/borgernes interesser?

2
1. april kl. 12:44

Det er jo tegn på et dårligt fungerende system.

Der er sjældent folk i disse komiteer, som ikke har en personlig interesse i at give adgang til data.

Problemet er vel i bund og grund at man netop deler data ud til hvem som helst, der gider at udfylde ansøgningen korrekt. Det klassiske DJØF-svar er jo, også her, øget bureaukratisering.

Hvorfor ikke rent faktisk sætte nogle folk i komiteerne, til at varetage patienternes/borgernes interesser?

1
1. april kl. 12:00

Det er jo tegn på et dårligt fungerende system.

Der er sjældent folk i disse komiteer, som ikke har en klar interesse i at give adgang til disse data.

Problemet er vel i bund og grund at man netop deler data ud til hvem som helst, der gider at udfylde ansøgningen korrekt. Det klassiske DJØF-svar er jo, også her, øget bureaukratisering.

Hvorfor ikke rent faktisk sætte nogle folk i komiteerne, til at varetage patienternes/borgernes interesser?