Data skal sikre mere effektiv vedligehold af ledningsnet

Hver enkelt forsyningsselskab har ikke data nok til machine learning - men de har til gengæld ikke noget imod at dele data med hinanden, lyder erfaringen fra projekt hos Orbicon
Brødtekst

Hvert år bruger forsyningsselskaber små ni milliarder kroner på at vedligeholde det danske vand- og spildevandsnet. Og hvert år baserer de store beslutninger om, hvilke dele der skal renoveres, sig på data med varierende kvalitet.

Det forsøger Orbicon Informatik sammen med en række forsyningsselskaber at ændre med machine learning-software til predictive maintenance. En softwareplatform, der skal forudsige, hvor ledninger klarer sig godt, og hvornår de har brug for at blive skiftet.

Det grundlæggende problem er, at det er meget svært at inspicere ledningsnettet, fortæller Anders Tvegaard, der er direktør i Orbicon Informatik.

»Den eneste måde, hvorpå du kan finde ud af, hvordan ledningen har det, er ved at gå ud og kigge ned i den,« siger han.

»Hvis du er en mellemstor dansk forsyning med 1.500 kilometer ledning, så er det ikke noget, du bare gør.«

Forsyningsselskaberne inspicerer i dag ledninger og rør med en tv-robot, hvor hver del af ledningen bliver vurderet på en 1-10-skala, hvor 10 betyder, at der er hul på den, og 1 betyder, at den har det fint.

»Det er en ekstremt manuel og dyr proces. Det kan koste 25-30.000 kroner pr kilometer, og det betyder, at vi har forsyningsselskaber, der kun har råd til at inspicere en begrænset del af deres forsyningsnet.«

I dag bliver inspektionerne typisk foretaget på baggrund af klager fra borgere over en lugt eller en brun plet på græsplænen, der tyder på, at spildevand slipper ud. Eller på grund af en simpel beregning om, at der er længe siden, en bestemt sektion er blevet inspiceret.

»Det er ikke en særlig effektiv måde at gøre det på,« bemærker Anders Tvegaard.

Lappe data-hullerne

Udfordringen ved at skabe et bedre grundlag for beslutningerne er, at forsyningsselskabernes data om, hvad der ligger under jorden, er af meget svingende kvalitet, fortæller Anders Tvegaard.

»Vi taler om ledninger, der er blevet lagt i jorden for op til 100 år siden. Dengang blev data tegnet ind på nogle papirkort, som siden er blevet digitaliseret. Og hver gang kan der være sket fejl,« siger han.

Dataformatet er – heldigvis – det samme gennem hele sektoren. Men diciplinen har været svingende, fortæller divisionsdirektøren. I en række tilfælde er ledninger blevet skiftet uden at data er blevet opdateret korrekt eller der mangler information of f.eks. alder, materiale, kote eller lignede.

»I sådanne tilfælde må vi forsøge at lappe hullerne,« siger Anders Tvegaard og fortsætter:

»Vi havde en case med en forsyning, hvor der for en del af deres ledningsnet ikke var angivet anlægsår, primært stikledninger (ledningen der gik ud fra hovedledningen til huset, red.). Der aftalte vi, at hvis hovedledningen er fra 1980, og bygningen er fra 1980, så satte vi anlægsåret for stikledningen til 1980. Det vil ikke altid være korrekt, men det vil det være for det meste. Og det er bedre end intet årstal.«

Derudover bliver manglende datakvalitet kompenseret af en aftale om datadeling mellem selskaberne. Da Orbicon Informatik søsatte det første pilotprojekt, blev det nemlig hurtigt åbenbart, at det enkelte forsyningsselskab typisk ikke har nok data til en avanceret analyse.

»I en mellemstor dansk by findes der måske 10.000 tv-inspektioner på 100.000 ledningskomponenter. Når vi begynder at lave filtreringen, så har vi kun meget lidt data på ledninger, der ligner hinanden, og det kan ikke blive statistisk validt.«

Derfor har Orbicon Informatik udviklet deres platform så forsyningsselskaberne kan dele data med hinanden – noget, der kun kan lade sig gøre, fordi forsyningsselskaberne ikke er i konkurrence med hinanden. Og på den måde får en lille forsyning adgang til op til 100 gange så meget data, når de skal tage deres beslutning, end de selv har på lager. 

Indtil videre har fem forsyninger implementeret systemet, mens flere end 20 selskaber leverer den nødvendige data.

Tv-inspektioner skabte træningsdata

Tv-inspektionerne er nøglen til hele projektet. Ved at sammenholde vurderingen fra den fysiske inspektion med al den data, Orbicon Informatik kan sammensætte om ledningen, kan man begynde at træne en machine learning-algoritme. Til formålet har Orbicon Informatik arbejdet med IBM's Watson-tjeneste.

»Vi tager 80 procent af data fra tv-inspektionerne og træner algoritmen, og så bruger vi de resterende 20 procent på at validere resultatet,« siger Anders Tvegaard.

Modellen scorer hver ledningsdel i rød, gul eller grøn – og den kategorisering rammer modellen lige nu med mere end 80 procents sikkerhed.

Orbicon Apex
Illustration: Orbicon Informatik
Modellen markerer ledningsdele med rød, hvis de sandsynligvis er i dårlig stand.

Algoritmen anvender data om, hvor ledningen ligger. Der kan fx være stor forskel på, om ledningen ligger i sandjord eller lerjord, om grundvandsstanden er høj eller lav, og om der er vej eller skov oven over. Dertil kigger Orbicon Informatik på, hvor meget ledningen er blevet brugt, og dermed, hvor meget slidtage der har været på ledningen.

Men de suverænt mest vigtige faktorer er alder og materiale, siger Anders Tvegaard.

»Vi kunne godt være startet bare med det. Men jo mere vi kan krydsreferere med andre faktorer, des bedre kan vi lappe de huller, vi har i datasættet, og sige noget om de ledninger, hvor vi ikke kender materialet.«

Datadeling 

Uanset de forskellige forsøg på at lappe eller kompensere for manglende data så giver tomme datafelter til tider en stor usikkerhed på algoritmens forudsigelse. Og det skal brugeren have at vide, siger Anders Tvegaard.

»Vi har hele tiden haft et designprincip om, at vi skal vise usikkerheden.«

Når kunderne anvender løsningen, vil de kunne se et kort over, hvad tv-inspektionerne fortæller, og supplere det med, hvad algoritmen forudsiger for resten af nettet. Sammen med beregningens sikkerhed kan brugeren se, hvor mange ledninger i et givent område f.eks. ikke har indtastet materiale.

»I nogle tilfælde vil forsyningen se på en rød linje, men samtidig få vist, at data er så dårlig, at forudsigelsen reelt ikke kan bruges. Og det kan så fordre en anden beslutning i selskabet, nemlig at få opdateret data i forbindelse med en tv-inspektion.«

På den måde kan de selskaber, som måske af historiske grunde har dårlig data, begynde at lukke hullerne.

Analyse skal medtage konsekvenser

I arbejdet med projektet, der har fået navnet data|APEX, gik Orbicon Informatik først og fremmest efter at få algoritmen til at komme med den bedst mulige forudsigelse af en lednings tilstand. Men efter flere måneders samarbejde med kunder står det klart, at tilstanden i sig selv ikke er nok for forsyningsselskaberne til at prioritere arbejdet.  

»Konsekvenserne af, at en ledning går i stykker, skal i virkeligheden vægtes lige så højt som ledningens tilstand,« forklarer Anders Tvegaard.

»Der er kæmpe forskel på, om en ledning leder til et hospital, om det leder til et afsides sommerhus, eller om det potentielt kan sende spildevand ud i en å med sårbart dyreliv.«

For at medtage konsekvenserne i analysen har Orbicon Informatik tilføjet data fra BBR-registret, som kan fortælle, hvem og hvor mange der bor i et område, og dermed hvem der bliver ramt, hvis en ledning går i stykker, samt inkluderet miljø og anlægsinformation fra nærområderne.

»På den måde kan forsyningsselskaber arbejde meget mere datadrevet og risikobaseret.«

Anders Tvegaard
Anders Tvegaard
Illustration: Anders Tvegaard

Anders Tvegaard er direktør i Orbicon Informatik. Anders har en kandidat i Kommunikation og Datalogi og har tidligere arbejdet som projektleder i Accelerance og SAP og som teknisk konsulent hos IBM.