Få nu forventningerne til AI ned på jorden

Brødtekst

Vi hører alt for ofte om AI’s store potentiale og når der endelig skrives om udfordringerne med AI, så er fokus på noget i retning af jordens undergang eller som minimum på at vi alle sammen bliver arbejdsløse. Der mangler en hel del realisme i AI-debatten!

Der er masser af eksempler på AI-projekter som ikke har levet op til forventningerne, f.eks. har jeg i et tidligere indlæg nævnt de mange AI-støttede chatbots, som sjældent kan levere, men der er jo også andre typer software med AI, som ikke leverer på leverandørernes løfter og forretningens forventninger.

I fagforbundet Djøf’s medlemsblad nr. 6, 2019, læste jeg forleden at Djøf, efter et 2-årigt projekt, havde skrottet en AI-baseret løsning til håndtering af 30.000 ansættelseskontrakter, fordi løsningen ikke kunne det man havde lovet dem.

Det lød ellers meget lovende i pressemeddelelsen fra 2017, hvor man kan læse at man bl.a. ville bruge projektet til at ”indhente førstehåndserfaringer med, hvordan automatisering og kunstig intelligens påvirker en arbejdsplads og de forskellige jobfunktioner”. Erfaringerne fik en ret definitiv konsekvens i april i år.

Så hvorfor fyrede Djøf deres AI-baserede ”kontorrobot”?

Djøfs forhandlingschef, Charlotte Thaning, var så venlig at afsætte tid til en snak om baggrunden for fyringen og hun fremhæver netop forventningerne til teknologien, som den primære årsag til at projektet fejlede.

"Kontorrobotten" skulle trænes til at identificere forskelle mellem ansættelseskontrakter, for at man skulle kunne fokusere på det som afveg fra normalen og dermed spare en masse tid.

Som eksempel på det som kontorrobotten forventedes at kunne, nævnte Charlotte Thaning bl.a. sammentælling af beløb vedr. løn og pension i ansættelseskontrakter, en opgave som desværre ikke kunne løses med AI, primært fordi softwaren ikke kunne finde rundt i strukturen i dokumenterne.

Medarbejderne i Djøf så ellers frem til at kunne overlade de mere ensformige opgaver til robotten, for selv at kunne fokusere på mere udfordrende opgaver. En fuldkommen god grund til at implementere software med kunstig intelligens!

Hos Djøf var man været klog nok til at lave en aftale man kunne komme ud af uden omkostninger, såfremt produktet ikke levede op til det aftalte. Men den tid man har brugt, kommer jo ikke tilbage.

For mig lyder det som om der er grundlæggende problemer med AI-funktionaliteten i softwaren iManage fra det engelske firma RAVN. I Wired Magazine online, bliver produktet meget positivt omtalt og de har tilsyneladende opnået en del succes med deres produkt i hjemlandet.

I artiklens eksempel har deres software tygget op til 600.000 sider juridiske dokumenter igennem om dagen, så Djøf’s bare 30.000 kontrakter burde ikke have gjort det ud for meget mere end en formiddags-snack.

Jeg mistænker, at det var det danske sprog, der spændte ben for Djøfs’s projekt, måske kombineret med for små datamængder. Produktet klarer sig tilsyneladende fint når det skal arbejde med meget større datamængder og på engelsk.

Er Danmarks digitalisering i fare på grund af vores modersmål?

En variation af AI som vi ikke hører så meget om som vi nok burde, er Natural Language Processing (NLP). Det er den teknologi som får aflyt-dig-selv applikationer som Apples Siri og Amazons Alexa til at virke, hvis du altså taler engelsk.

Det er også centralt i løsninger som Djøfs iManage og de talrige programmer til tale-genkendelse og stemme-identifikation, som man kan finde i markedet. Sprog, hvad enten det er talt eller skrevet, er meget vanskeligt at håndtere for en computer og derfor er korrekt sprogunderstøttelse, i form af NLP, helt nødvendigt for at få den type software til at fungere.

Det er helt grundlæggende ting som syntaks og semantik, som giver problemer for de algoritmer der gemmer sig i NLP. Også sådan noget som sarkasme, tvetydigheder, ironi og grammatik er en kæmpe udfordring. Hvis jeg nu skriver "Det er fint", så kan det jo tolkes på mange forskellige måder. Og når vi taler utydeligt eller med slang og dialekt, bliver det endnu værre.

Faglige termer, som f.eks. jura, er et helt kapitel for sig, men burde kunne håndteres af en slags standard-bibliotek for juridiske termer, hvis eller nogen ville producere og vedligeholde sådan et.

Der bruges enorme summer, udenfor Danmark, for at få NLP til at virke bedre og bedre, men de små sprog som dansk, bliver der ikke investeret i. Det får nogle producenter af software med NLP til at påstå, at NLP er uafhængigt af sprog, men jeg har bevist overfor de samme producenter at det ikke passer. Charlotte Thaning fra Djøf bekræftede overfor mig at det var præcis hvad sælgerne af Djøfs kontorrobot havde sagt, hvilket var medvirkende til at man købte iManage.

Hvis vi skal være med på NLP-vognen skal vi enten droppe dansk og skifte til engelsk, eller også skal vi have politikerne med. Jeg har spurgt vores IT-ambassadør Casper Klynge, eller rettere hans kontor i Palo Alto, hvad han gør for at få vores modersmål ind i varmen hos de store producenter over there? Det fik jeg ikke svar på, men jeg blev gjort opmærksom på at den netop afgåede regering faktisk havde tænkt over det og lavet en strategi for AI. Den er fra marts 2019, så den er meget ny og man kan jo ikke regne med at den næste regering vil støtte op om den, men den er faktisk meget interessant.

Først og fremmest så bemærker jeg, at man fra politisk hold, er klar over problemet med NLP og at det holder digitaliseringen tilbage. På side 36 kan du læse at man har planlagt at udvikle en "fælles dansk sprogressource" som skal stilles gratis til rådighed. Sådan! Og der er meget andet godt i dokumentet. Måske skal vi have den, forhåbentligt, kommende IT-minister til at tage fat på udfordringen med at få det virkeliggjort. Vi er flere år bagud.

Men lad mig komme tilbage til det med forventningerne.

Hvordan siger man til ledelsen at deres forventninger til AI er helt ude af trit med virkeligheden?

Man fristes til at sige lad være. De vil alligevel ikke tro på dig, for de flinke konsulenter og sælgere har for længst forsikret dem om at deres AI-software er helt sprog-uafhængigt og kan klare enhver opgave. "Millionbesparelserne ligger lige om hjørnet og alle de andre gør det jo allerede", plejer det at lyde.

Jo, du skal naturligvis spille din viden på banen og gøre dem opmærksom på risikoen, selvom det ikke altid er populært.

Det andet du kan gøre som IT-medarbejder er at insistere på at kontrakten med leverandøren indeholder en testperiode, der skal bevise at AI-delen af produktet rent faktisk virker og hvis ikke, så kan dit firma komme ud af aftalen uden omkostninger. På den måde kan du redde firmaet fra en dum brøler, ledelsen kan redde lidt ansigt og IT-afdelingen kan vise sit værd.

Den tredje mulighed er at styre interessen over på områder hvor AI har bevist sit værd igennem længere tid, typisk indenfor det man kalder decision support, altså analyser på big data til understøttelse af ledelses-beslutninger.

Til sidst vil jeg gerne opfordre til at vi taler lidt mere om vores fiaskoer i IT-afdelingerne og generelt IT-branchen. Vi har en meget kedelig tendens til at feje svipserne ind under gulvtæppet (med mindre det er statens milliard-bøffer), at lade hunden spise business casen eller at tale et bittert flop op til en nær-succes og det gavner ingen i det lange løb.

Hvis ikke vi taler om vores fejlskud, så tror andre virksomheder på de fantastiske historier som sælgerne løber med og det koster bunker af penge, som kunne være brugt bedre. Det går også ud over IT-afdelingernes troværdighed hvis ikke de i det mindste prøver at få lidt realisme ind i debatten, især når det drejer sig om noget så kompliceret som AI og NLP.

Hvem er først? Eller jeg mener, hvem er nummer to, nu da Djøf, modigt, er gået foran.

Dette indlæg er oprindeligt bragt på DataTechs søstermedie Version2.