Ulykkesdata – balancen mellem store mængder data og data af høj kvalitet

Ulykkesdata er en vigtig del af arbejdet med trafiksikkerhed. I dette indlæg forklarer Ida Hvid og Marianne Foldberg Steffensen fra Vejdirektoratet, hvordan de arbejder med bias og mørketal i datakilderne.
Brødtekst

Viden om trafikulykker er en grundlæggende forudsætning for at kunne arbejde målrettet med at forbedre trafiksikkerheden i Danmark. Det er vigtigt, at vi kan undersøge, hvor og hvorfor ulykkerne sker, og at vi kan følge med i udviklingen.

Derfor er der også stor efterspørgsel på data. Der findes en del data som alle er relevante i arbejdet med trafiksikkerhed. Alle datakilderne har fordele og ulemper, og alle kilderne indeholder bias og mørketal. Men blot man har det for øje og husker ikke at blande kilderne sammen, er der meget viden at hente.

Hvilke datakilder bruges i dag?

I dag baseres hovedparten af ulykkesanalyserne på de politiregistrerede ulykker. Der er mange væsentlige fordele ved politidata. Vejdirektoratets ulykkesstatistik er baseret på detaljerede og systematiske registreringer af hændelsesforløb og lokalitet udført af politiet. Registreringerne er kvalitetssikret af Vejdirektoratet og kommunerne og bearbejdet til at passe til formålet, altså til brug i trafiksikkerhedsarbejdet.  Desuden er politidata en meget stabil datakilde, og der er blevet indsamlet data efter samme principper og systematik igennem en lang årrække. Det betyder, at politidata også er velegnet til at beskrive udviklingen i trafikulykker over tid.

Der er dog mange ulykker, der ikke kommer til politiets kendskab, og nogle typer ulykker er særligt underrepræsenterede i politidata. Det gælder især eneulykker og ulykker med lette trafikanter. Derfor er det relevant også at tage andre datakilder i brug. 

De mest aktuelle datakilder, der kan bruges som supplement til politidata, er at finde inden for sundhedsvæsnet, nemlig landspatientregisterdata, skadestuedata og ambulancedata. Kort fortalt er de primære fordele ved data fra sundhedsvæsnet, at der bliver registreret et meget stort antal tilskadekomne, og at lette trafikanter i højere grad registreres.

Den primære ulempe er, at data er mindre detaljerede, særligt når det kommer til de trafikale aspekter, og at der derfor er begrænset viden om hændelsesforløbet, de involverede parter, ulykkesstedet osv. Der er en række lokale projekter med skadestuedata, hvor der foretages supplerende registreringer, hvilket gør data mere brugbare i relation til trafiksikkerhed. Her er oplysninger om de trafikale forhold dog baseret på selvrapportering, og det medfører en vis usikkerhed. Ved brug af sundhedsdata skal det holdes for øje, at dræbte er underrapporterede, fordi personer der dør på ulykkesstedet i sagens natur, ikke bliver behandlet i sundhedsvæsnet. 

Hvilke ønsker og behov er der til data?

Der er mange forskellige aktører og faggrupper, der arbejder med trafiksikkerhed, og det stiller meget forskellige krav til data. I nogle sammenhænge vil det være vigtigt at have en stor mængde af data, i andre sammenhænge er det vigtigt at have meget detaljerede oplysninger. I jagten på ”den perfekte datakilde” er det vigtigt at forholde sig til, om den effekt der kan opnås ved at indsamle mere data, også står mål med de ressourcer det vil kræve. Desuden er det vigtig at forholde sig til kvaliteten af de data, der bliver indsamlet. 

Alle de datakilder, der er i spil, har forskellige styrker og svagheder. Der findes ikke én ”perfekt” datakilde, som kan det hele. Politidata er en meget robust datakilde, og der er flere væsentlige fordele ved politidata, som de øvrige datakilder har svært ved at matche. Pt. omfatter ulykkesstatistikken ca. 12-13.000 trafikulykker om året og danner dermed et solidt grundlag for en meget stor del af det trafiksikkerhedsarbejde, der foretages i Danmark. 

Data fra sundhedsvæsnet, har nogle svagheder, som gør at de ikke uden videre egner sig som den primære kilde til ulykkesdata (underrapportering af dræbte og manglende fokus på trafikale aspekter). Men data fra sundhedsvæsnet er et rigtig godt supplement til den officielle ulykkesstatistik, fordi de netop kan være med til at belyse nogle af de temaer, der er underrapporterede i politidata, så som lette trafikanter. 

Hvad gør vi så?

Der er stor forskel på, hvilken type af informationer der optræder i de forskellige datakilder. Desuden bliver der brugt meget forskellige definitioner på helt centrale parametre. Fx er der stor forskel på, hvad der defineres som en trafikulykke, og på hvornår en person regnes som tilskadekommen. Det betyder at data fra én kilde ikke uden videre kan sammenlignes med data fra en anden kilde. Derfor er det også vanskeligt at kombinere data fra politi og sundhedsvæsen til én samlet datakilde på en meningsfuld måde.

Der er dog et stort potentiale for at få ny viden om trafikulykker, ved at bruge de enkelte datakilder hver for sig, og benytte den viden vi kan få fra de forskellige datakilder til at belyse trafiksikkerhed fra flere vinkler. I den sammenhæng er der behov for et større kendskab til de eksisterende datakilder inden for sundhedsvæsnet: Hvordan kan de forskellige parametre fortolkes? Hvor retvisende er data? Hvilke bias er der i data? osv. Desuden er der brug for mere udbredt erfaring med hvornår og hvordan de forskellige datakilder kan anvendes.

Færdselssikkerhedskommissionen har, som led i den nye nationale handlingsplan, besluttet at afholde en workshop om ulykkesdata. Her vil aktører fra både vejbestyrere, forskningsverdenen og sundhedsvæsnet blive inviteret til at deltage i en dialog om ulykkesdata. Formålet med workshoppen er dels at få bedre kendskab til hvordan eksisterende data kan bruges, og dels af have en dialog om hvilken udvikling, der skal ske fremover inden for indsamling og brug af ulykkesdata. Vejdirektoratet vil i løbet af foråret tage hul på planlægningen af denne workshop.