Sådan påvirker 13 år gammel kildekode corona-bekæmpelsen i England og USA

Foto : petovarga / Bigstock

Sådan påvirker 13 år gammel kildekode corona-bekæmpelsen i England og USA

Britiske Neil Ferguson skrev for mere end 13 år siden kildekode til modellering af influenza-epidemier. I dag har den haft stor indflydelse på håndteringen af coronavirus i både Storbritannien og USA.
Brødtekst

VERSION2: »Jeg er klar over, at mange folk gerne vil se og køre pandemi simulationskoden, som vi anvender til at modellere kontrolforanstaltninger mod COVID-19. For at give lidt baggrund – Jeg skrev koden (tusinde af linjers udokumenteret C) for 13+ år siden for at modellere influenza-epidemier...«

Sådan tweetede Neil Ferguson, leder af britiske Imperial Colleges Abdul Latif Jameel Institute for Disease and Emergency Analytics (J-IDEA) og MRC Centre for Global Infectious Disease Analysis søndag den 22. marts.

Lidt over en uge tidligere havde hans model vendt op og ned på Storbritanniens strategi for bekæmpelse af coronavirussen. Simuleringer ved hjælp af modellen viste, at hvis Storbritannien slet ikke gjorde noget, ville antallet af døde blive over en halv million, mens en flokimmunitet-strategi med karantæne af virusramte samt opfordringer til ældre og særligt udsatte om at blive hjemme ville resultere i 250.000 døde.

Kun ved hjælp af langt skrappere tiltag som lukning af skoler, pubs, restauranter samt et lockdown, hvor folk holder sig indendøre, ville dødstallet kunne minimeres.

De beregninger fik Johnson-regeringen til at opgive sin hidtidige afslappede bekæmpelsesstrategi og indføre mere stringente kontrolforanstaltninger for at begrænse antallet af døde. Den samme model blev anvendt til at simulere antallet af døde i USA, og da modellen estimerede at 2,2 millioner amerikanere ville dø uden nogen indgreb, fik det Donald Trump til at anbefale amerikanere at arbejde hjemmefra og undgå større forsamlinger.

Samarbejde med Microsoft og Github

I sit tweet lovede Neil Ferguson, at kildekoden ville blive gjort offentlig i løbet af 7-10 dage, da koden blandt andet skulle dokumenteres, refaktoreres og forbedres, så andre nemmere kunne anvende modellen.

Microsoft og Github samarbejdede med forskerne på Imperial College om at forbedre koden, men midt i en pandemi har Neil Ferguson og hans kollegaer travlt, og derfor har det taget lidt længere tid at få kildekoden offentliggjort.

Version2 har været i løbende kontakt med Neil Ferguson, og i en mail 14. april, oplyser Neil Ferguson, at han »jonglerer med adskillige prioriteter«, men forventer at koden vil blive offentliggjort på Github »i løbet af de næste par dage«.

Det kom til at tage lidt længere tid, da der også skulle laves en brugergrænseflade frem for det originale kommandolinjebaserede program.

»Meget snart – det er udelukkende blevet forsinket da vi ønsker at frigive et UI på samme tid. Microsoft udvikler det,« skriver Neil Ferguson i en mail til Version2 fredag 24. april.

Koden er endelig frigivet på MRC Centre for Global Infectious Disease Analysis' Github-repostitory Mrc-ide. Her findes en række andre modeller, men det er denne som er Neil Fergusons oprindelige, men refaktorerede og dokumenterede kildekode for pandemi-modellen.

Neil Ferguson gør selv meget ud af at understrege, at der er tale om modeller af virkeligheden.

»Vi bygger simplificerede repræsentationer af virkeligheden. Modeller er ikke krystalkugler,« har han tidligere udtalt til det videnskabelige tidsskrift Nature.

Agentbaserede modeller og relevante data

Selve modellen og koden er baseret på en modellering fra 2005 af hvordan H5NI fugleinfluenzaen ville udvikle sig i Thailand. Der er tale om en agentbaseret model, hvor data om hvordan enkeltindivider opfører sig, hvilke kontakter de har og andre relevante data, som kan anvendes til at modellere spredningen af virussen, indarbejdes i modellen.

I 2005 var den største udfordring for Neil Ferguson at få fat i detaljerede data om den thailandske befolknings aktivitetsmønstre, og det er også en af udfordringerne i dag for forskere verden over, når de forsøger at modellere Covid-19 spredningen.

I 2018 organiserede BBC sammen med London School of Hygiene and Tropical Medicine (LSHTM) (en stor undersøgelse af den britiske befolknings kontaktmønstre, og resultaterne af den undersøgelse anvendes i dag til at berige agentbaserede modeller med data om kontaktmønstre.

Dansk models anvendelse af britiske data

Det er blandt andet tilfældet med modeller udarbejdet af den danske ekspertgruppe nedsat af Statens Seruminstitut, der forsøger at forudsige konsekvenserne af at åbne langsomt op for de restriktive tiltag mod coronavirussen.

De modeller er tilsvarende Neil Fergusons model, og ekspertgruppen skriver, at modellerne kan belyse 'udviklingen af smittespredningen i Danmark, belastningen af kritiske sygehusfunktioner, herunder intensivpladser, respiratorkapacitet og ECMO-behandling samt effekten af nuværende og mulige myndighedstiltag, herunder effekten ved at ophæve disse,' som det hedder i ekspertrapporten fra Statens Seruminstitut 6. april.

Ekspertgruppen understreger ligesom Neil Ferguson, at modelleringen er 'forbundet med store usikkerheder, fordi menneskers adfærd er kompleks og ændrer sig under en pandemi, og fordi vi mangler en fuld forståelse af smitterisiko forbundet med forskellige typer social adfærd for denne nye type af pandemivirus.'

Ekspertgruppen har anvendt data fra BBC-undersøgelsen, hvilket betyder yderligere forbehold for modellens forudsigelser.

»Det er gruppens opfattelse, at de engelske kontaktdata, vi har brugt i modellerne, kan undervurdere effekten af daginstitutioner, da brugen af daginstitutioner er mere udbredt i Danmark, og de engelske kontaktdata vil dermed give mindre smitte, end vi ser det i danske undersøgelser af daginstitutioner.«

Med Neil Fergusons ord, så er modellerne altså simplificerede repræsentationer af virkeligheden, men de er det bedste, vi har til at udvikle prognoser for coronavirussens spredning.