Kampen mod coronavirus vil teste potentialet for datadrevet forskning på et nyt niveau

Brødtekst

Mikroorganismer udgør i dag en af de største trusler mod jordens befolkning på højde med klima katastrofer og atomkrig. En helt afgørende forskel er, at hele kloden kan samles om en intensiv indsats mod en fælles fjende, når vi bliver ramt af vira, som det nu er sket med coronaen.

Det er en global og meget konkret målsætning for anvendelsen af alle de fremskridt, vi har set indenfor kunstig intelligens de sidste 10 år.

 

Ambitionen er gået fra et videnskabeligt kapløb mellem mennesker og algoritmer om udførelse af de samme opgaver, til at accelerere løsninger på en global udfordring. Vi er i åben krig med en virus, der ligner en blanding af influenza og lungebetændelse – og kan slå hundredetusindvis af mennesker ihjel. Den smitter bredt via kontaktsmitte og væskedråber fra nys og host, man er smitsom uden symptomer og der findes endnu ingen medicinsk behandling.

Vi kan begrænse udbredelsen af smitte via vores adfærd og samvær – men vi kan kun effektivt stoppe udbredelsen, når vi finder en medicinsk behandling.

Et kapløb med virussen

Gængse forsigtighedsprincipper for udvikling af medicinsk behandling foreskriver et forløb fra laboratorieprøver til test på dyr, over en lille testgruppe af mennesker til en større – og endelig til tusindvis af mennesker, inden en medicinsk behandling kan godkendes til distribution land for land. Dyrkning af prøver, tests, observationer, dokumentation, logistik og godkendelser tager gerne 10+ år gennem tre faser før en ny medicinsk behandling kan tilbydes bredt.

Fra en egentlig corona-epidemi blev konstateret i Kina og til samfundet lukkede ned i Danmark, gik der 3 måneder! Nu tæller dansk erhvervsliv dagene til månedsskift og nye regninger – og til at regeringen har frigivet arbejdskraft og handel igen. Vi har brug for at kunne identificere og godkende en medicinsk behandling med syvmileskridt sammenlignet med den traditionelle tilgang.

Derfor har vi startet et kapløb mod coronavirus om dekodning og nedkæmpning. En af vores store udfordringer er, at analyser på mikrobiologisk niveau i levende organismer har et uoverskueligt antal af årsag og effekt kombinationer. Den mængde af igangværende ideer, eksperimenter, teorier og resultater, der bliver undersøgt kloden rundt, er det ikke menneskelig muligt at skabe overblik over.

Derfor skal vi bruge simulationsstøtte og overblik for at kunne følge med og videreudvikle hinandens ideer i så stort og komplekst et forskningsområde og community.

De største teknologileverandører, akademiske institutioner og offentlige instanser samles nu om at levere den støtte og skabe videnskabelige fremskridt gennem avanceret data-analyse, der kan kompensere og/eller accelerere laboratorietest og kliniske forsøg. Det er et hidtil ukendt omfang af globalt samarbejde for at opfylde den målsætning – og langt større end hver enkelt af de globale medicinselskaber kunne drive af investeringer på området hver for sig.

CORD-19

AI2 (Paul Allens institut), Microsoft, Zuckerberg Chan med flere har reageret på en forespørgsel fra det Hvide Hus og samlet publikationer fra hele verden i et format – CORD-19. Datasættet kan bearbejdes af kunstig intelligens som Natural Language Processing til f.eks. konstant at monitorere nye og eksisterende publikationer for relaterede teorier, resultater, eksperimenter m.m.

Google udstiller CORD-19 datasættet i en af deres Kaggle konkurrencer. Kaggle er en åben online platform, kendt verden over blandt data scientists, som afholder konkurrencer i data science på udvalgte datasæt. CORD-19 er vokset til 45.000 artikler, der er blevet bearbejdet af bl.a. AI2, så de kan tilgås i et læsbart format.

Konkurrencen søger svar på 10 præ-definerede opgaver med underspørgsmål, så der er meget stort potentiale for synergier på tværs af analyser. De dækker over inkubationstid, vaccine-muligheder, medicinsk behandling m.m.

”Vi lægger dette datasæt ud til på 4,3 millioner dataforskere i håb om, at verdens AI-samfund kan hjælpe med at finde svar omkring COVID-19” sagde Anthony Goldbloom, Kaggles medstifter og CEO, i en pressemeddelelse fornylig.

På en måned - fra 15. marts til 20. april - er datasættet blevet set 1.32 millioner gange, downloadet 54.200 gange, og der er kommet analyseresultater fra 1143 forskellige data scientists; hovedsageligt fra USA og Indien indtil videre.

Mange initiativer

Den første deadline for den globale online data science konkurrence om at finde svar på nogen af de mest presserende spørgsmål omkring coronavirus har allerede afsløret brugbare insights. Dette er bl.a insights om formeringsraten af virus, inkubationstid fra smitte til symptomer fordelt på aldersgruppe og køn samt risikofaktorer.

Der er mange flere initiativer i verden omkring data science i kampen mod coronavirus, og de inkluderer adgang til de kraftigste computere i verden. EU har tilbudt assistance fra de 3 supercomputing centre i Italien, Spanien og Tyskland. I USA har de etableret ”The COVID-19 High-Performance Computing Consortium” med Amazon, Microsoft, Google, IBM, NASA, det Hvide Hus m.fl.

Ressourcerne i konsortiet inkluderer adgang til verdens største super computer – Oak Ridge National’s 200 petaflop supercomputer.

Herhjemme har Novo Nordisk lige inkluderet projektet ”Applied Artificial Intelligence for real-time risk assessment of patients with COVID-19, Rigshospitalet” under de akutte coronavirus puljemidler fra Novo Nordisk Fonden.

Al kommunikation online afspejler en lyst til at dele og hjælpe hinanden frem mod en hurtig udvikling af vacciner og medicinsk behandling, så potentialet i at kunne accelerere udvikling af medicin ved hjælp af kunstig intelligens og avanceret data analyse vil blive testet på et nyt niveau med indsatsen mod coronavirus og vise, hvad der er menneskeligt og fysisk muligt i dag.

Selvom medicinske forskere ikke normalt vil have adgang til det niveau af ressourcer, er der meget potentiel læring omkring fremtidigt potentiale i data drevet medicinsk udvikling - mod alle de vira, vi må forudse vil komme fra det eksotiske dyreliv vi presser mere og mere ved at ødelægge deres levesteder og inkludere dem som føde til en voksende befolkning.