Energinet vil slippe elforbrugernes fortrolige data løs i anonym form

Graf, kommuners elforbrug
Energinet vil i fremtiden frigive flere forbrugsdata i anonymiseret form for at fremme den grønne omstilling. Illustration: Energinet. Se større version
Der er stor efterspørgsel på at bruge de fortrolige forbrugsdata i Energinets enorme database, Datahub. Nu har Energinet fundet en teknisk løsning, der gør det muligt at åbne for meget af Datahub'en uden at kompromittere forbrugernes anonymitet.
Indblik23. januar 2020 kl. 06:05
errorÆldre end 30 dage

Der er både forretningsmuligheder og et stort grønt potentiale i at lægge dataene om hver enkelt danskers elforbrug i den såkaldte Datahub ud til fri afbenyttelse. Men da indholdet af den store database er betragtet som følsomme persondata, står GDPR-forordningen – rimeligt nok – i vejen for bare at åbne sluserne.

Alligevel er der hos Datahub’ens ejer, Energinet, et brændende ønske om at bruge de værdifulde data til mere end bare fakturering af elforbrug, som er databasens primære formål i dag.

Og den statslige virksomhed står ikke alene. Under den forrige regering anbefalede det såkaldte grønne vækstteam i begyndelsen af 2019 frisættelse af forbrugsdata som et af de vigtigste redskaber til at gøre Danmark til frontløber i den globale grønne omstilling. 

Desuden er aktører i elbranchen generelt enige om, at adgang til højt opløselige energidata er nødvendige for at afgrænse og frigøre potentialet for fleksibilitet blandt elforbrugerne, hvilket anses som afgørende for at få enderne til at mødes i en fremtid, hvor elsystemet skal agere rygraden i et kraftigt elektrificeret samfund.

Læs også: Forbrugs-app kan hjælpe med at aktivere fleksibilitet på villavejen

Anonymisering koster værdi

Frisættelsen er dog lettere sagt end gjort. Selv renset for direkte identifikatorer såsom adresser, er det med adgang til de rå forbrugsdata i Datahub’en muligt at udlede oplysninger, der kompromitterer forbrugernes anonymitet. For flere virksomheder følger elforbruget desuden omsætningen og er derfor en vigtig konkurrenceparameter at kunne holde hemmelig.

Problemet er naturligvis løst, hvis Energinet anonymiserer dataene, inden de udleveres til eksterne aktører. Det kunne ske ved at lægge så mange datapunkter sammen, at det er umuligt at regne sig baglæns og identificere datakilderne. Men jo længere væk, tallene kommer fra det enkelte målepunkt, des mindre er de værd.

Derfor har Energinet i samarbejde med eksperter i anonymisering af data fra SDU, Alexandra Instituttet og Danmarks Statistik nu set nærmere på en metode, der både sikrer fortrolighed og høj opløselighed i energidata.

»Man kan sætte det op på et kontinuum, hvor de rene data har allerhøjest værdi. Helt i den anden ende er de aggregerede data, hvor værdien er lav, fordi behovet for anonymisering vejer tungest. Det, vi har kigget på, er, hvordan vi kan skubbe til de grænser, så vi kan øge værdien af data samtidig med at vi opretholder fortroligheden,« Kristina Hansen Hadberg, der er forretningsudvikler ved Data og Digitalisering hos Energinet.

Vi vender tilbage til Energinets løsning senere. Først skal vi lige omkring, hvordan frigørelsen af data mere konkret kan hjælpe Danmark fremad i den grønnere omstilling.

Højere opløsning efterspørges

Datahub’en indeholder forbrugsdata for de cirka 3,3 millioner danske elforbrugere tilbage til 2013, hvor databasen blev oprettet. I takt med, at udrulningen af fjernaflæste målere i disse måneder gøres færdig landet over, vil de 3,3 millioner data-rækker gå fra at bliver opdateret med ét nyt datapunkt årligt til at få et nyt hver time, svarende til 8.760 nye målepunkter om året for hver elkunde.

Ved sammenkøring med andre databaser såsom boligregistret, folketal og virksomhedsregistret, kan energidata give virksomheder og myndigheder værdifulde indsigter, der kan bruges i mange arenaer af den grønne omstilling.

Et eksempel, man kunne forestille sig, var at krydse de detaljerede forbrugsdata fra Datahub’en med oplysningerne i Bygnings- og Boligregistret (BBR-registret) og på den måde udlede viden, der kunne automatisere energimærkningen af bygninger.

Dataene er også meget anvendelige i de grønne regnskaber, som nogle kommuner stadig udgiver. I dag har kommunerne allerede adgang til et datasæt leveret af Energinet, der gør dem i stand til at få indblik i kommunens samlede elforbrug pr. måned, og hvordan forbruget fordeler sig over husstandstyper og brancher.

Men både den tidslige og geografiske opløsning er for ringe til, at kommunerne for eksempel kan identificere specifikke områder inden for kommunegrænsen, hvor elforbruget ser uhensigtsmæssigt ud, og dermed er det svært for forvaltningen at sætte målrettet ind med energieffektiviseringstiltag.

Også virksomheder og forsyningsselskaber står på spring for at omsætte de detaljerede data i Datahub’en til digitale, grønne værktøjer. 

»Et formål kunne være at træne modeller til at genkende forbrugsmønstre i husstande, så forbrugere kan få en advisering om, at deres varmepumpe måske trænger til at blive skiftet. Det kunne også være den lokale bager, der ville have fordel af at sammenligne sig med andre bagerforretningers strømforbrug for at blive klogere på, om han kan optimere sit elforbrug og dermed sin forretning,« siger Jesper Kronborg Jensen, der er senior forretningsudvikler hos Energinet.

Han suppleres af Kristina Hansen Hadberg.

»Derudover kan dataene understøtte nye innovative løsninger i forhold til automatisering af elforbruget, så vi i højere grad kan lægge det på tidspunkter, hvor der er overskud i nettet og optimere i forhold til andelen af vedvarende energi i strømmikset. Det ligger lidt længere ude i fremtiden, men det er noget af det, vi gerne vil hen imod,« siger hun.

Data tilsættes støj

I projektet, der løb over stablen på bare fem dage (et såkaldt ‘sprint’), nåede Energinet især til én afgørende erkendelse: Hvis forbrugsdataene skal have værdi for kommuner og virksomheder, er det afgørende, at de beriges ved sammenkøring med andre relevante datasæt, inden anonymiseringen finder sted. Det fandt ekspertgruppen en metode til:

Først flettes de rå og endnu uanonymiserede forbrugsdata sammen med andre registre via en ‘nøgle’, der går igen i alle datasæt – for eksempel adresseoplysninger. Dernæst analyseres, hvor mange ens forbrugere, der er i det sammensatte datasæt, mens forbrugere med helt unikke karakteristika fjernes. 

Til sidst påføres forbrugsdataene en smule matematisk ‘støj’, som gør det umuligt at regne sig baglæns til den oprindelige værdi uden dog at ødelægge den information, tallene repræsenterer. Mængden af støj, der skal påføres, afhænger af, hvor mange ens forbrugere, der er i det sammensatte datasæt. Jo flere, des mere indbygget anonymitet og dermed behov for mindre støj.

»Ved at lægge støj på vores data kan vi komme helt ned på den enkelte husstands timeforbrug, uden det er muligt at se, hvis data der er tale om. Det giver en opløsning i data, som rigtig mange kan få gavn af,« siger Jesper Kronborg Jensen

Skal Energinet levere data?

Energinet sidder i forvejen på rigtig mange data, som det i dag udgiver i forskellige standardiserede statistikker på sitet energidataservice.dk. Men her er tale om forsyningsdata, der ikke er i karambolage med GDPR-lovgivningen. 

Med efterspørgsel på flere og flere skræddersyede datasæt, der kræver grundig analyse og anonymisering, rejser spørgsmålet sig om, hvorvidt det overhovedet er Energinets opgave at bearbejde de mange data for eksterne aktører. Og det er organisationen da også stadig selv i gang med at finde ud af.

»Hvis vi skal kunne levere de data, der bedst understøtter udviklingen og den grønne omstilling, så skal de beriges i et eller andet omfang. Derfor skal vi træffe en beslutning omkring, hvad vores rolle i det skal være. En model kunne være, at vi indgik i et samarbejde med en ekstern aktør, der så kunne foretage berigelsen for os,« siger Kristina Hansen Hadberg.

Projektet blev udarbejdet i regi af Energinets Open Door Lab, som er en idéaccelerator, der afprøver og demonstrerer forretningsmodeller i elmarkederne baseret på data og digitale løsninger.

Ingen kommentarer endnu.  Start debatten
Debatten
Log ind for at deltage i den videnskabelige debat.