Machine learning forudsiger forsinkede pakker hos PostNord

Robotten Egil har forbedret PostNords evne til at spotte pakker, der bliver forsinkede. Nøglen var en digital infrastruktur, der tog tre år at opbygge.
Brødtekst

Hver gang PostNord sender en pakke, bliver den scannet omkring ti gange, før den lander i hænderne på modtageren. 

Når cirka 1 million pakker i Norden dagligt går igennem systemet, betyder det, at omkring 10 millioner datapunkter bliver genereret hver eneste dag. For et år siden begyndte PostNord at analysere på al data i eventloggen.

»Vi fandt ud af, at vi kunne bruge den data til at lave forudsigelser – for eksempel om, hvorvidt pakker bliver forsinkede,« fortæller Petter Edlund, der er Head of Business IT i PostNord.

Det gælder ifølge Edlund 3-5 procent af pakkerne.  

»Historisk har vi gjort det manuelt, men ofte sker det slet ikke, fordi det tager for lang tid og er en tung manuel proces. Så hitraten for det manuelle system var under ti procent,« beretter han. 

Med en machine learning-løsning er effektiviteten steget betydeligt. Systemet – der går under navnet Egil – kan korrekt forudsige halvdelen af PostNords forsinkede pakker alene på baggrund af eventlog-data.

»Lige nu arbejder vi på at forbedre modellen ved at tilføje lokationsdata, så vi kan regne ud, hvor en pakke burde være på et bestemt tidspunkt for at komme frem til tiden.«

Modellen skal forbedres

For hver pakke giver modellen, som kaldes ‘Risk for Delay’, en risikofaktor, der repræsenterer sandsynligheden for, at pakken ikke kommer frem til tiden. Hver gang pakken bliver scannet, justeres den risiko, og hvis den når en bestemt grænseværdi, forventer systemet, at pakken forsinkes. 

»Den information bliver så sendt til vores kontroltårn og til brugeren, der har sendt pakken,« fortæller Petter Edlund. 

»Vi vil gerne gå videre til at sende informationen ud til modtageren også, men inden vi gør det, vil vi gerne have, at modellen er endnu bedre. Vi har ikke lyst til at sige til modtageren, at pakken er forsinket, hvis den ikke er det og omvendt.«

Machine learning-modellen kan også bruges til at forbedre PostNords nuværende udregning af ETA – Estimated Time of Arrival. Allerede i dag har PostNord viden ned til timetal om, hvornår de forventer at være fremme.

»Men det er ikke detaljer, vi informerer kunder om, fordi vi vil være sikre på, at vi kan håndtere, når der opstår pludselige ting som trafikpropper,« siger Petter Edlund.

»Med machine learning kan vi forbedre vores forudsigelser, så vi kan informere brugeren mere præcist.« 

På et sølvfad

Inden PostNord overhovedet kunne begynde at overveje machine learning, måtte koncernen give hele sin it-infrastruktur en overhaling. 

»Vi begyndte for tre år siden at indføre en helt nye it-tilgang, hvor vi oprettede agile teams i vores logistik- og e-commerce-afdelinger. Vi dekoblede vores legacysystemer fra alle vores kundevente løsninger og begyndte at udvikle apps, API'er og webinterfaces i AWS,« fortæller Petter Edlund. 

»Samtidig blev al data skubbet op i Elasticsearch på Amazons sky, så vi kan cache det og indeksere det og have en hurtig brugergrænseflade for alle vores tjenester.«

Da PostNord senere begyndte at kigge på machine learning, var det hele serveret på et sølvfad, beretter Edlund. 

»Data var allerede i skyen og allerede cachet i Elasticsearch. Vi kunne gå direkte i gang med at arbejde med data og bygge modellerne oven på,« siger han. 

Krævende at gå i produktion

Petter Edlund ser it-moderniseringen som afgørende for at få succes med machine learning-projektet.

»Jeg tror, det er noget, som mange andre kæmper med. Man kan bygge en prototype og træne en algoritme. Men at tage den derfra og til produktion er typisk ret svært,« siger han. 

»Den nye infrastruktur var helt og aldeles nødvendig, før vi kunne starte med machine learning,« understreger han. 

Modellerne i brug er alle open source med XGBoost som den mest populære, fortæller Petter Edlund. 

De rigtige personer

Hele Egil-projektet er styret af to personer i PostNord, der har defineret, hvordan pipelinen skal hænge sammen og trænet modellen. Det handler om kvalitet frem for kvantitet, bemærker Petter Edlund. 

»Min erfaring er, at hvis du har de to rigtige, dygtige personer, så kan de gøre fantastisk meget og få hurtige resultater. Jeg foretrækker en arbejdsmodel, hvor få personer arbejder på et produkt frem for at gennemføre store undersøgelser eller drive store, lange projekter med hundredvis af personer.« 

Med Egil-projektet i produktion ser PostNord også på andre anvendelsesområder for machine learning – som f.eks i sorteringsmaskinerne i samarbejde med maskinernes leverandør.

»Modellerne kan lære at genkende labels, der ikke er standardiseret. Især fra Kina får vi mange labels, som ikke følger standarden for, hvor de forskellige informationer står. Det har tvunget os til at manuelt sortere de pakker.«

Og det er ikke småting, en god model kan bidrage med i den sammenhæng.

»I Sverige havde vi sidste år en periode med op til 160.000 pakker fra Kina om dagen gennem Arlanda, som vi har været nødt til at sortere manuelt. Så det er et kæmpe problem.« 

Siden har nye toldregler lagt en dæmper på svenskernes lyst til at købe fra Kina. Men PostNord forventer, at interessen vender tilbage, og når det sker, er selskabet bedre forberedt med machine learning.