Bayesian ML vs. aktiemarkedet: Det giver os meget information, når modellen ikke ved, hvad den skal gøre

aktier
Illustration: Berya113 / bigstock. Se større version
Investeringsbranchen har en aversion mod black box-modeller, men priors kan hjælpe på tilliden, fortæller startup.
Indblik14. januar 2020 kl. 04:05
errorÆldre end 30 dage

At lave præcise forudsigelser af aktiemarkedets bevægelser med machine learning er en tiltalende tanke, og mange har forsøgt – og fejlet. 

Det notorisk utilregnelige aktiemarked reagerer på alt fra Donald Trumps tweets til investorernes mavefornemmelse, hvilket alt sammen er vanskeligt at forudsige med tilpas sikkerhed til, at man bør sætte opsparingen på spil. 

Så hos danske AI Alpha Lab lader man være med at forsøge.  

»Vi ville rigtig gerne kunne estimere fremtidige afkast. Kan vi det, så ender vi som Warren Buffet på et tidspunkt,« indleder CIO Mikkel Petersen. 

»Det er det, som alle prøver, og det er nok også grunden til at, det er rigtig svært. Vi har intet belæg for at sige, at vi kan estimere fremtidig afkast godt nok. Der er simpelthen for meget støj.«

Men der er andre ting, som machine learning kan forudsige med nogenlunde sikkerhed. Og i AI Alpha Lab forsøger de at bygge bro mellem brugen af machine learning og evidensbaseret investering. 

»Vi tager udgangspunkt i, hvad vi historisk har været i stand til at estimere, og hvad vi brug for at estimere, og hvad har vi en idé om, vi bør kunne estimere.«

Det, der kan estimeres, er dels markedets fremtidige volatilitet – eller risiko – og dels fremtidige korrelationer. Begge dele med tilpas sikkerhed til, at det skaber højere afkast, fortæller Mikkel Petersen. 

»VI går lidt den anden vej end meget af industrien, hvor der er meget fokus på at finde fremtidens vindere, der giver høje afkast. Vi er mest interesseret i at undgå taberne og dem, hvor der er størst usikkerhed, og på den måde skabe højere afkast. Den tilgang har vi ganske enkelt belæg for virker.«

Bayesian deep learning

Nøglen til den strategi ligger i såkaldt bayesian neurale netværk, der giver mulighed for at estimere usikkerhed i en machine learning-model. Hvis et basalt neuralt netværk f.eks. trænes til at klassificere hunde og katte, og herefter viser et billede af en Folkevogn, vil den stadig gætte på, om billedet forestiller en hund eller en kat, frem for at erkende, at den ikke har nogen anelse. 

Når det ikke er billede-klassificering, men store investeringsporteføljer, er det kritisk at vide, om modellen er sikker i sin sag eller dybest set gætter. 

»I vores verden er det helt fint, hvis den ikke kan forklare, hvad der foregår. Så lader vi bare være med at investere i en givent aktiv,« fortæller Mikkel Petersen. 

Usikkerheden i sig selv er en vigtig information for startup-virksomheden, der blandt andet har bygget et såkaldt multi-asset investeringsprodukt op alene om den usikkerhed, som modellen spytter ud.

»Grundlæggende er det sådan, at forøget volatilitet er associeret med fald. Når der går panik i markedet, har priser det med at falde hurtigere end de stiger, når der ikke er
usikkerhed, hvilket kaldes statistical leverage.. Og det, vi kan se, er, at modellens usikkerhed afspejler fænomenet ret godt,« siger Mikkel Petersen og fortsætter: 

»Lige så snart, der er usikkerhed på markedet, er modellen hurtig til at afspejle det i sit eget usikkerhedsestimat. Det viser, at der sker noget på markedet, som den ikke kan forklare. Og det giver mening, fordi det typisk er, når markedet begynder at falde, at mennesker tager flere beslutninger, som ikke rigtig bunder i nogen fornuftig information.«

Helt konkret betyder det, at AI Alpha Labs investeringsmodel kan begynde at flytte rundt på elementerne i portefølje, og vægte dem, som den stadig kan forstå.

»Det betyder at den begynder at vægte sikre aktiver, der er mere stabile. Og det er lige der, vi gerne vil ligge investeringsmæssigt i sådanne perioder,« siger Mikkel Petersen. 

Økonomisk viden i modellen

En anden fordel ved bayesian deep learning er muligheden for kombinere træningsdata med domæneviden. 

Et simpelt eksempel på, hvordan det fungerer, er en model, der skal forudsige sandsynligheden for, at en mønt lander på plat eller krone. Hvis et træningssæt på 10 forsøg resulterer i 7 gange plat og 3 gange krone, ville en ikke-bayesiansk model fordele sandsynligheden for de to resultater til 70 pct. og 30 pct.. Men med bayesian machine learning kan vi indkode som såkaldt prior i modellen, at vi er 99 pct. sikre på, at mønten er balanceret og således tilføje vores viden om mønten til modellen. 

Hos AI Alpha Lab oplever man det som en kritisk funktion. Da virksomheden i første omgang trænede et neuralt netværk alene på finansdata, var resultaterne langtfra imponerende, fortæller Mikkel Petersen. 

»Vi satte os ned og lavede priors på baggrund af markedets mikrostrukturer og evidensbaseret viden om, hvordan markedet fungerer. Og ved at inkorporere noget af den viden har vi fået nogle helt andre resultater. Det har været helt afgørende, og det har også øget vores blod på tanden. Vi gik fra at modellen, uden anden information end data, egentlig ikke gjorde det særlig godt, til at de her priors netop gør den i stand til at levere gode resultater.«

Priors som X'et i XAI

Priors har også været centrale, når det handler om at overbevise nye og eksisterende kunder, fortæller Mikkel Petersen. 

»Der er en generel aversion i branchen mod black box-modeller. Kunderne vil gerne forstå, hvad der foregår, og der er en grænse for, hvor meget vi kan forklare dem. Vi bliver nødt til at sige, at helt ind i maven på dyret ved vi ikke, hvad der foregår. Det er også det, der skal give os bedre resultater – fordi vi mennesker ikke kan trække en lige streg igennem alting og give en forklaring,« siger han og fortsætter:

»Men derfor er det også vigtigt, at vi kan forklare, at vi lægger nogle grundlæggende finansielle koncepter ind i modellen, som kunden forstår. Så det er en vigtig brik i tillidsopbygning med kunderne, at vi kan lægge en prior ind.«

»Jeg er overbevist om, at hvis du kommer med en ren black box-model, som ikke har priors, så bliver den aldrig adopteret i branchen. Lige så snart den ikke performer, som den skal, så vil du ikke have nogen mulighed for at forklare, hvad der går galt. Og det kan den type kunder, vi arbejder med, ikke leve med.«

Data-light

Modellen, som AI Alpha Lab indtil videre har udviklet, er på data-siden fortsat simpel, fortæller Mikkel Petersen. 

»Vi giver den ikke ret meget data. Vi vil gerne have meget hånd i hanke med, hvad modellen kan, og hvor værdien kommer fra, så vi er startet med nogle simple iterationer. I første omgang har vi lavet en model, hvor vi kun har givet den prisdata og nogle grundlæggende makroøkonomiske data,« siger han og fortsætter:

»Der har været en tendens til, at de, der forsøger at gøre det her med AI, losser al data ind på en gang. Så står man bagefter og kan ikke forklare, hvor informationen kommer fra.«

Og det er igen ikke holdbart, når pensionskassen eller kapitalforvalteren skal overbevises. 

»Vi tror, det er kritisk, når det drejer sig om at forklare kunde, hvad modellen baserer sig på. Men det er også kritisk, hvis modellen pludselig ikke performer. Så tror vi på, at vi har en bedre mulighed for at skille den ad og finde ud af, hvad der går galt.«

Selvom virksomheden nu vil arbejde med at tilføje mere data til modellen, er den større opgave at overbevise kunder om, at den systematiske AI-tilgang er fremtiden. 

»Det er ikke generelt holdningen derude lige nu. Så vi skal have vendt den her elefant. Kunderne hænger ikke på træerne, så vi skal være skarpe i vores forklaring af denne nye verden.«

Ingen kommentarer endnu.  Start debatten
Debatten
Log ind for at deltage i den videnskabelige debat.