Sådan undgår du, at datasøen bliver et hængedynd

Foto : Olga Gavrilova, BigStock

Sådan undgår du, at datasøen bliver et hængedynd

Flere norske kommuner begynder nu at bruge den hypede teknologi.
Data lakes er et fænomen, du kommer til at høre meget mere om i tiden fremover. Her gør vi et forsøg på at afmystificere hypen, kigge på fordelene samt pege på nogle af faldgruberne. Denne type it-løsning handler om at skaffe sig indsigt i egne data og en ny mulighed for at gøre nytte af indhold fra mange forskellige kilder. Og analyser, som der tidligere ikke var mange, der tog sig råd til.
Vil du have fuld adgang til DataTech?

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra Machine Learning-modeller til dataetik.

Fakta om data lakes

Ifølge Gartners definition er en data lakes en samling af lagringsinstanser, man passer på ud over de originale datakilder. Indholdet bevares nær-identisk eller som identiske kopier eller udtræk. Hensigten med data lakes kan være at tilbyde uraffinerede visninger eller visualisering af data blandt andet til brug i analyseformål. Det skal give muligheder ud over det, som er sædvanen i mere traditionelle løsninger, som blandt andet data warehouses.

En data lakes kan indeholde alle mulige slags data, både strukturerede og ustrukturerede data. Ikke bare dokumenter og tekst, men også billeder, video og lydfiler.

I forslaget til en ny norsk arkivlov, som er til høring i disse dage, er data lakes så centralt, at det er medtaget i titlen på den offentlige udredning: ‘NOU 2019:9 Fra kalveskinn til datasjø’.

Arkivlovudvalget definerer begrebet på følgende måde: Data lakes er informationssystemer, hvor man tager sig af store mængder (rå)data i den oprindelige form på tværs af flere datakilder. Data laken gør det muligt at udlede dokumentation i realtid og efterfølgende, gerne ved hjælp af nye teknologier som for eksempel maskinlæring.

Bergen, Stavanger, Oslo og Bodø er blandt de kommuner, som enten er i gang med eller planlægger at etablere data lakes i Norge.