Ugens data: Regeringen lancerer ny digitaliseringsstrategi med massivt fokus på data og AI. Men der er et stort “men”

digitaliseringsstrategi
Illustration: Mikkel Bjerg Kristensen.
Vi ser tilbage på ugen i data science.
6. maj kl. 07:59
errorÆldre end 30 dage

I går lancerede regeringen sin nye digitaliseringsstrategi, og den fokuserer massivt på styrkelse af brugen af data og kunstig intelligens i det offentlige.

Læs mere her: Den nye digitaliseringsstrategi landet: Microsoft-chef får central rolle

Den nye digitaliseringsstrategi præsenterer 61 initiativer, der blandt andet går på at bruge ny teknologi til at accelerere den grønne omstilling, effektivisere den offentlige sektor, løfte cybersikkerheden og i det hele taget »sætte retningen for samfundets digitale fremtid,« som det fremgår af pressemeddelelsen. Og så skal der etableres et Digitaliseringsråd, som Microsofts adm. direktør i Danmark og Island, Nana Bule, skal være formand for.

På data-fronten, er det især værd at lægge mærke til, at regeringen med sin nye strategi understreger, at der skal være øget fokus på etik og ansvarlighed, og at data fra det offentlige skal betragtes som »et fælles gode,« og således skal ikke-personhenførbar data fra det offentlige gøres tilgængelige for forskere, virksomheder og offentlige myndigheder. Det skal styrke innovationen og lette implementeringen af datadrevne AI-løsninger i den offentlige sektor.

Artiklen fortsætter efter annoncen

Ifølge regeringen, vil der være en sidegevinst ved Digitaliseringsstrategien og den øgede brug af nye teknologier. Den gevinst er, at 10.000 årsværk kan frigøres til mere borgernære velfærdsopgaver, og det er her, hvor vi finder vores store “men”. Hvordan det skal finansieres er nemlig fortsat uklart, men i den økonomioversigt, der følger med Digitaliseringsstrategier, er der sat nul kroner af til formålet.

I et svar til DataTech lægger Finansministeriet vægt på, at det er netop AI-løsninger som skal frigøre årsværk. Her nævnes som eksempel signaturprojektet Smartmail - intelligent håndtering af mails, der er forankret i Norddjurs Kommune. Projektet har, ifølge en foreløbig evaluering fra Digitaliseringsstyrelsen, sparet Norddjurs kommune tre ud af fem medarbejdere til mailsorteringsarbejde.

»Målsætningen om at frigive 10.000 årsværk over de næste 10 år ved anvendelse af ny teknologi og automatisering er en ambitiøs politisk ambition, der skal bidrage til at drive udviklingen. Målsætningen er baseret på analyser og erfaringer fra allerede igangsatte projekter i stat, kommuner og regioner. Det kan for eksempel være implementering af smartmail til automatisk at sortere e-mails, automatisk journalisering af mails i forbindelse med sagsbehandling, implementering af algoritmeunderstøttet vagtplanlægning i plejesektoren eller robotter til transport af vare og affald på fx hospitaler,« lyder det fra ministeriet.

Birgitte Arent Eiriksson, der er medlem af Dataetisk Råd og vicedirektør i Justitias, stiller sig dog skeptisk over for målsætningen om, at øget digitalisering nødvendigvis vi frigive 10.000 årsværk.

»Når man på denne måde fremskriver en teknologisk effektivisering i nedbringelse af årsværk i den offentlige sektor, bringer det desværre erindringer frem om den tidligere reform af SKAT. Dengang blev der lavet en fejlslået fremskrivning, som vi mildest talt stadig kæmper med de negative konsekvenser af. Man skal passe meget på med at lade sig forblænde af digitaliseringens potentiale, således at man fjerner det menneskelige blik for skøn, kontekst og refleksion, inden de teknologiske løsninger tillader det,« udtaler hun.
 

STATISTIK: DDSC udgiver lønstatistik

Dansk Data Science Community (DDSC), der for nyligt blev stiftet som officiel forening, har netop lanceret resultaterne fra sin lønundersøgelse 2022.

På baggrund af 365 besvarelser, har DDSC udarbejdet et dashboard, der viser, hvordan danske data scientists’ lønninger fordeler sig på uddannelsesniveau, sektor, antal års erfaring, jobtitel og så videre.
Lønstatistikken dækker over løn plus pension, mens eventuelle bonusser ikke er medregnet.

Og det er måske ikke overraskende, at statistikken viser at de højeste lønninger findes i pharma, imens de to sektorer, der udbetaler den laveste løn, er den offentlige sektor samt uddannelses- og forskningssektoren. 

I uddannelses- og forskningssektoren, viser statistikken, at det er de PhD-studerendes løn, der trækker tallene ned. Det er nemlig den jobtitel, der kaster den absolut laveste løn af sig sammenlignet med de øvrige jobtitler. De højeste lønninger bliver generelt udbetalt til folk med senior titler.

ddsc
Illustration: Torben Albert-Lindqvist, Dan Saattrup Nielsen og Kasper Groes Albin Ludvigsen fra Dansk Data Science Community.

FORSKNING: Ny forskning om håndtering af toksisk tekstdata

I DataTechs nyhedsbrev fra sidste fredag, skrev vi om, at der er en ny opdatering af Danish Gigaword korpus på vej. 

En af nyhederne ved opdateringen er, at tekstdata fra sociale medier så vidt muligt er blevet pillet ud af datasættet. Leon Derczynski, der er projektstyrer på The Danish Gigaword Project og lektor ved IT Universitetet, fortalte til DataTech, at man traf valget om at fjerne SoMe-dataen, fordi nylige undersøgelser peger på, at især tekst fra især sociale medier ofte rummer skadeligt indhold.

Nu har Leon Derczynski, i samarbejde med forskere fra The Alan Turing Institute, Oxford University og Mozilla Foundation, udgivet en ny forskningsartikel, der netop omhandler risikoen for skadeligt indhold i tekstdata samt giver nogle løsningsforslag til, hvordan man håndterer den slags udfordringer, inden man begynder at træne sine NLP-modeller.

I forskningsartiklen påpeges det, at de senere års hastige udvikling inde for deep larning har betydet, at træningsdatasæt til udvikling af NLP-modeller er vokset sig så store, at det er praktisk umuligt at tjekke for skadeligt og toksisk indhold, såsom misinformation og diskrimination, der “kan blive gengivet af modeller, som trænes på datasættene.”

Derfor foreslår forskerne også et framework kaldet HarmCheck til at adressere, håndtere og informere om potentielt skadeligt indhold i tekstdata. HarmCheck er grundlæggende en checkliste, som især forskere, kan drage nytte af. Det er nemlig ved at blive mere og mere almindeligt, at konferencer og publikationer, forlanger at der udfyldes såkaldte “responsible NLP research checklists”, når man indsender forskningsartikler på NLP området.

LITTERATUR: Ny bog om AI og social intelligens

Nogle DataTech-læsere vil formentlig kende navnet Elena Esposito. Hun er professor i sociologi ved Bielefeld University og University of Bologna, hvor hun forsker i sociale systemer og algoritmer, og så er hun nok især kendt for forskningsprojektet The Future of Prediction: Social Consequences of Algorithmic Forecast in Insurance, Medicine and Policing.

I sin kommende bog, Artificial Communication: How Algorithms Produce Social Intelligence, argumenterer Elena Esposito for, at det er misvisende når vi drager paralleller mellem algoritmer og menneskelig intelligens. Så når for eksempel chatbots og virtuelle assistenter umiddelbart ser ud til at udvise en form for social intelligens, så er det ikke fordi, de har lært at tænke som mennesker, men snarere fordi mennesker har lært maskinerne at kommunikere med os. 

Derfor foreslår Elena Esposito, at vi holder op med at tænke på maskinerne som en form for “kunstig intelligens”, og i stedet betragter dem som “kunstig kommunikation”. 

»For at gøre dette har vi brug for et kommunikationsbegreb, der kan tage højde for muligheden for, at en kommunikationspartner ikke er et menneske, men en algoritme - som ikke er tilfældig og er fuldstændig kontrolleret, om end ikke af menneskelige processer,« lyder det ifølge MIT Press’ beskrivelse af bogen.

Artificial Communication er en del af MIT Press’ serie, Strong Ideas, der indeholde titler som Sharenthood: Why We Should Think before We Talk about Our Kids Online af Leah A. Plunkett og Data Feminism af Catherine D'Ignazio og Lauren F. Klein.

Artificial Communications udkommer den 24. maj og kan forudbestilles på Saxo.

EVENT: Hvad skal din teenager i sommerferien?

På Computer Science Camp. Selvfølgelig!

Den 9-16 juli afholder Ungdommens Naturvidenskabelige Forening (UNF) nemlig sommerlejr for gymnasieelever med interesse programmering og computerteknologi. Og selvom DataTechs kernelæsere formentlig ikke længere har alderen til at deltage, så skal der lyde en klar opfordring til at fortælle jeres børn, yngre søskende, niecer, nevøer og naboens unger om muligheden for at komme på sommerlejr.
På årets lejr vil frivillige fra UNF organisere sociale aktiviteter og undervise i blandt andet machine learning og Python-programmering, men det kræver ingen større forudsætninger at deltage på campen.

»Det er vigtigt for os, at alle kan være med og opleve, hvor fedt datalogi er, uanset om de har programmeret siden de var 10 år eller om de aldrig har åbnet en text editor,«, udtalerfagligt ansvarlige Nikolaj Ulrik i pressemeddelelsen.

Nikolaj Ulrik forklarer endvidere at »datalogi og programmering er emner, der sjældent findes på gymnasierne og kan være svære at studere selv, så vi vil også gerne kunne give en smagsprøve på, hvilken viden og hvilke færdigheder der ligger bag programmerne på din computer.«

Sommerlejeren foregår på Datalogisk Institut på Københavns Universitet i København. Tilmelding skal ske senest den 1. juni, og det koster 500 kr. pr. deltager inkl. kost, logi og medlemsskab af UNF.

Ingen kommentarer endnu.  Start debatten
Debatten
Log ind for at deltage i debatten.
settingsDebatindstillinger