De 7 vaner, der fører til meget effektiv AI

Succesfulde datadrevne virksomheder har en nærmest religiøs fiksering på multi-dimensionelle datasæt, skriver it- og investeringsguru Shomit Ghose
Brødtekst

Nævn ét firma et hvilket som helst sted i verden – bare et! – der ikke bliver disrupted af Amazon eller Google.  Disse to firmaer – og de andre tilhængere af big data og machine learning – er i dag på vej ind i alle industrier til stor fare for både store og små virksomheders konkurrenceevne.

Sundhedssektoren og de finansielle industrier er blandt dem, der har den højeste risiko, når det gælder disruption fra AI. Til dato har forsøg på at imødegå denne disruption tilsyneladende spændt fra en forsigtig trinvis stigning til en ynkelig humpen. Hvis man virkelig skal adressere AI’s disruption, vil det kræve, at alle virksomheder selv bliver AI-drevne disruptors. I forretningsverdenen er det sådan i kampen mellem “trinvis” og “disruptiv”, at “trinvis” sjældent vinder. Men præcis hvordan bør virksomheder, der ikke hedder Amazon eller Google, opbygge disruptive AI-løsninger?

At svømme med hajer

De bedste skabeloner for, hvordan man opbygger en data-drevet virksomhed, ligger ligefor: som Amazon, Google, Uber og flere mindre velkendte teknologivirksomheder, hvis eneste mål er at bygge disruptive forretningsmodeller udelukkende på et fundament af data. Det, de har til fælles, er deres næsten religiøse fiksering på multi-dimensionelle (“hyper-dimensionelle”) datasæt, som anvendes ved at bruge multi-dimensionelle metoder. Lad os se på, hvad dette betyder, ved at bryde det ned i 7 best practices:

  1. Start med forretningsmodellen. Punktum. Hvis der ikke er nogen overbevisende økonomisk fordel under forretningsmodellen, vil ingen AI eller data kunne gøre nogen som helst forskel. Amazon og Google har det fællestræk, at de kun fokuserer på applikationer med kvantificerbare fordele i multi-milliard-dollar-markeder, som understøtter problemfri skalering. Og det er simpelthen den stabile størrelse på sundheds- og økonomi-markederne (på engelsk kaldet ‘health and wealth’), som nu tiltrækker det ødelæggende blik fra disse AI-baserede disruptors.
     

  2. Forudsig fremtiden. Data kan forudsiges på to måder: for at forstå fortiden eller for at forstå fremtiden. En endimensionel tilgang til at fortolke data ville være simpelthen at gøre det første: analysere dataene – og det kan godt være, de er ‘big’ – for at fastslå, hvad der allerede er sket. Interessant business intelligence, men af taktisk værdi i et landskab, hvor alle industrier er blevet en handelsvare. Strategisk værdi i det kommercielle marked ligger i at være i stand til at forudsige fremtiden. Det er i denne ekstra dimension af dataanalyser, at firmaer som Amazon og Google excellerer.

    Inden for sundhedssektoren er der for eksempel ubestridelig værdi i anvendelsen af machine learning til korrekt at diagnosticere et biopsibillede.  Men en diagnose er blot en enkelt (retrospektiv) dimension af et datasæts semantik. Forudsigelse føjer multi-dimensionel semantik til data, og det er forudsigelse, der fører til forebyggelse (eller som minimum tidlig intervention), hvilket derpå fører til omkostningsreduktioner. Machine learning anvendt til at forudsige sundhedstilstande i fremtiden – i alt fra humør- og angstproblematikker til dødeligheden ved hjerte-kar-sygdomme og den generelle helbredstilstand i befolkningen –  er den måde, hvorpå sundhedssektoren måske kan eftergøre det, Amazon allerede har gjort i den meget mere prosaiske industri, der har at gøre med detail-logistik.
     

  3. Data-rigdom: gennem proprietære datakilder. Hvis data er den ultimative kilde til værdi (og det er den!), så ligger forsvaret for alle teknologier eller virksomheder i at identificere en proprietær datakilde. (Se her, hvordan Cozi har gjort dette). Men en proprietær datakilde er kun ét sted at starte. Hvis data udgør den ultimative kilde til værdi, så er endnu mere proprietær data – dvs. datarigdom – altid påkrævet: Data skal kontinuerligt forsøges at blive gjort mere multidimensionel. Tag Google som eksempel. Selvom virksomheden producerer data, der allerede er proprietær og massivt-dimensionel, så brugte Google for nylig over to milliarder dollars på at købe Fitbit. Fitbits multi-dimensionelle sundhedsdata er nu en del af Googles proprietærdatastrøm. Og dét er datarigdommens religion ført ud i livet.

    Amazon er også massivt-dimensionel og fokuseret på datarigdom. Firmaet er ikke tilfreds med bare at få dine data relateret til dine online- og offline-oserier og -indkøb. Vi ved fra videnskabelig litteratur, at både ansigter og stemmer kan afsløre, hvordan en persons sundhedstilstand er. Så det er ikke nogen overraskelse, at Amazons utrættelige jagt på datarigdom har manifesteret sig i patenter inden for sundhedssektoren, både for ansigts- og stemme-analyser.
     

  4. Data-sult: efter multi-dimensionelle data fra eksterne kilder. Hvis data er godt, så er flere data bedre. Det inkluderer multi-dimensionelle data, som er hentet fra alle tænkelige eksterne kilder, hvad enten disse kilder er frit tilgængelige (f.eks. fra offentlige instanser) eller er tilgængelige gennem partnerskaber. Det geniale ved Ubers 2013-patent, ‘System and Method for Dynamically Adjusting Prices for Services’, er ikke en uigennemtrængelig machine learning-teknologi, men den brede multi-dimensionalitet af de datastrømme, Uber indtager for præcist at kunne forudsige prisen for en (transport)ydelse: alt fra vejret til valgdage eller en bys første skoledag, sociale netværk-data, flyinformation, nyhedsinformation osv. – du forstår, hvad jeg mener.

    Julapa Jagtiani og Catharine Lemieux fra Federal Reserve Bank of Philadelphia fortæller, at multi-dimensionelle (‘alternative’) data i lån til fintech nu muliggør “øget adgang til kredit til en lavere pris til de kreditværdige individer, som har en tynd kredithistorik. Fintech-startup’en Prosper “får 500 stykker data om hver låner”, og andre, såsom SoFi og Kabbage, har været i stand til at udnytte multi-dimensionelle data til at flytte sig helt væk fra dårlige kreditscorer for at finde ‘usynlige gode' kredit-kunder’.

    Hvad kan nogle af disse deterministiske multidimensionelle datasignaler være? Tobias Berg et al. skriver for det uafhængige organ Federal Deposit Insurance Corporation, at blandt andet tidspunktet på dagen, om kunders navne står i deres e-mail-adresse, og om kunder laver slåfejl, alle påvirker deres lånerisiko. Den kinesiske fintech-virksomhed Yongqianbao analyserer mere end 1.200 datapunkter, der beregner lånerisikoen for forbrugere, der har utilstrækkelig adgang til bankydelser. Dette inkluderer mobiltelefondata til at beregne risici for folk, der ikke besvarer telefonopkald, eller hvis udgående opkald ikke bliver besvaret. 
     
  5. Brug adfærdsøkonomi. Amazon, Google og Uber er mestre i at fuldende data-’cyklussen’ ved at benytte sig af multi-dimensionelle metoder. Specifikt kombinerer de alle data med adfærdsøkonomi for at skubbe på slutbruger-adfærd i retninger, der er en fordel for deres forretning. Responsen på denne adfærdsøkonomimetode bliver konstant monitoreret og fodret tilbage ind i machine learningen som endnu en optimering af den multidimensionelle datastrøm.

    Inden for fintech bruger startups som Lemonade adfærdsøkonomi til at skabe positiv brugeradfærd. Men adfærdsøkonomi som en multi-dimensionel metode – gennem gamification, nudging, standardindstillinger (defaults) og lokkedueeffekten – behøver ikke udelukkende blive brugt til at øge omsætningen. Adfærdsøkonomi er blevet anvendt på en række forskellige sundhedsapplikationer, f.eks. som drivkraft for screening for tyktarmskræft, organdonation og rygestop og endda til at forbedre plejen efter hjerteanfald og kirurgisk hygiejne.

  6. Mål resultaterne og forfin dem i realtid. Det er vigtigt at forstå, at produkterne af de fem første trin nævnt ovenfor er a) en indtægtskilde; Og b) en datastrøm. Datastrømmen måler og rapporterer på præcisionen i fremtidsforudsigelserne og effektiviteten i adfærdsøkonomi. Disse læringer udgør endnu en multi-dimensionel metode: De fødes tilbage i systemet, så algoritmer, datakilder og teknikker konstant kan rettes og forbedres.
     

  7. En sidste multi-dimensionel metode, og en, der måske ikke er indbygget i AI-drevne virksomheder grundlagt de seneste år, er at bygge etik ind i forretningsmodellen fra dag et. Vær etisk. Punktum. Hent data etisk, og anvend data etisk. At opføre sig etisk betyder ikke blot at have en politik på plads, men konstant at stille spørgsmål til den etiske konsekvens af alle beslutninger og handlinger. Det betyder, at vi skal være etiske, både når AI’en træffer beslutninger for os, og når vi træffer beslutninger baseret på AI’ens anbefalinger. Der er en proces med konstant årvågenhed. Kun gennem etik kan vi opbygge virksomheder, der kan konkurrere og overleve.

Amazoogle
Amazoogle-modellen
Illustration: Shomit Ghose

At være konkurrencedygtig, at være relevant

At overholde de best practices, der nævnes ovenfor, er ingen garanti for succes inden for sundhedssektoren, i fintech eller i nogen anden industri. Men det at diskutere disse guidelines kan måske hjælpe organisationer til, som minimum, at være ordentligt forberedt på den uundgåelige kamp med de store tech-virksomheder, der bruger AI. Hvis dine fremtidige konkurrenter vil benytte sig af multi-dimensionelle data på multi-dimensionelle måder, må du hellere forberede dig på det, mens der stadig er tid. Måske kræver din specifikke forretningsmodel ikke, at du overholder alle syv ‘vaner’. Men tag alt i betragtning (som standard), før du dømmer noget ude (efter smertefulde overvejelser!).  At disrupte din egen forretning er svært. Men det er bedre, at du gør det selv, end at en konkurrent gør det for dig.

Disruption vil komme til alle industrier. Hvis det gøres rigtigt, ville denne disruption hjælpe med at bringe velfortjente ydelser ud til befolkninger, der ikke nyder godt af dem nu. De vil også bringe skalerbare (billigere) ydelser til dem, der allerede nyder godt af teknologiens fordele, og det på en måde, der er etisk og bæredygtig. Hvis disruption ikke gøres på den rigtige måde – ved at se på innovation i et snævert-dimensionelt perspektiv – vil det betyde, at AI-dreven disruption kun bliver for nogle få monopolistiske virksomheder. Dem, der har, vil få mere, og dem, der intet har, vil stadig ikke have noget.