Dansk reenforcement learning giver grønt signal i lyskryds

Lyskryds grønt lys
Illustration: Bigstock/ktsdesign. Se større version
Markov decision process kan løse problemet med rødt lys i tomme kryds. Teknikken reducerede forsinkelser i trafikken i Vejle med 18 procent.
27. oktober 2020 kl. 05:55
errorÆldre end 30 dage

Kender du det med, at man holder i et lyskryds, hvor signalet er rødt – og der er ikke andre trafikanter end dig i miles omkreds? Mon ikke nogen overvejer at sætte egen vurdering højere end færdselsloven i den situation – men hvis politiet skulle være med på en kigger, vanker der bødeforlæg.

Nu kan man slippe for det problem. Virksomheden Advanced Traffic Systems (ATS), der er et spin-out fra Aalborg Universitet, har udviklet teknologi, der kan bidrage til, at trafikken glider bedre i signalregulerede kryds. Teknologien er afprøvet i Vejle. En undersøgelse af et stort kryds på en af de store indfaldsveje til byen har vist, at systemet reducerede forsinkelser i trafikken med 18 procent.

Markov decision process

Modellen er deep reinforcement learning, fortæller Andreas Berre Eriksen, som er topchef i ATS.

»Den kan lave simuleringer frem i tid,« fortæller han til Datatech. Han er i øjeblikket på orlov fra sine ph.d.-studier på Institut for Datalogi på Aalborg Universitet for at koncentrere sig om virksomheden.

Algoritmen er en Markov decision process, som giver grønt lys for bilisterne.

»Den tager højde for, hvornår der kommer nye biler, og hvordan biler ellers opfører sig – altså lærer det miljø, man har at gøre med, at kende.«

Data bliver primært produceret af radar.

»Det er en klassisk Doppler-radar, der sender bølger ud og måler differencen, når bølgerne kommer tilbage. Så laver den lidt signalbehandling og konverterer til biler og længder på dem og selvfølgelig også hastigheder.«

Radaren returnerer et x- og y-koordinat på position, og det samme på hastighed. Data bliver renset med et filter, som er en afart af et såkaldt Kalman-filter, for at holde styr på tracking.

»Det er lavet til at spore objekter, som bevæger sig i et forudsigeligt mønster, som eksempelvis en bil på vej mod en stopstreg i et lyskryds.«

Radarerne sampler med en frekvens på 20 Hz, så man har 20 observationer pr. bil pr. sekund.

»Men vi nøjes med at lave et estimat pr. sekund, så vi vurderer, hvor bilen er i slutningen af sekundet, i stedet for at have alt for høj granularitet. Det er for at algoritmerne kan følge med.«

Beslutningen tages på stedet

Det er såkaldt edge-analyse, hvor beslutningen tages på stedet, og ikke i skyen eller andre steder.

»Det dur ikke, hvis vi mister forbindelsen kortvarigt – så kan man ikke styre lyskrydset. Det sidder i lyskrydset, i en lille computer, der lytter direkte på radarerne og vurderer, hvad der skal gøres.«

Algoritmen udføres på den indlejrede enhed i en boks i signalanlæggets styreskab. Deep reinforcement learning  er valgt, fordi den løsning er god til at kontrollere systemet:

»Når man har et system med usikkerhed, som med et lyskryds, hvor der kan komme nye biler ind i systemet, som vi gerne vil håndtere i forhold til at optimere og lave en fremskrivning fra starttiden, som vi observerer på, og 25 sekunder ud, så vi kan lave en strategi, hvor vi har forskellige handlinger.«

Og her passer modellen med en Markov decision process rigtig godt på problemet.

Handlingen er indstillingen af lyskrydset – om der skal man skiftes fra rød til grøn, og i hvilken retning skal man skifte. Data giver informationer om det aktuelle antal biler, men også rettidigheden på eksempelvis busser og trafikafviklingen i nærliggende kryds. Algoritmen beregner som nævnt én gang i sekundet den optimale styringsstrategi for krydset for de næste 20 sekunder.

Software udviklet på Aalborg Universitet

ATS benytter modelleringssoftwaren UUPAAL til at håndtere lyskrydsene. Det er udviklet på Aalborg Universitet igennem de seneste 20 år. Det giver en fordel, siger Andreas Berre Eriksen:

»Vi har algoritmer, som ligger klar i systemet. Når man først har en model, der kan tage imod data, så får man resten foræret.«

Flere danske kommuner samt byer i Indien, Tyskland og Kina har vist interesse for virksomhedens løsninger.

Ingen kommentarer endnu.  Start debatten
Debatten
Log ind for at deltage i den videnskabelige debat.