Radikale forandringer i data science-job på vej

Brødtekst

Engang var der en person, der gjorde det, vi bruger en lommeregner til i dag. Webmaster var engang en hot karriere. Engang havde mellemledere sekretærer.

I alle disse tilfælde skete der det, at fremskridt inden for hardware og software tog specialiserede færdigheder og lagde dem i hænderne på generalister.

Mens specialistjob blev tabt, frigjorde demokratiseringen af disse teknologier bølger af innovation, handel og jobskabelse.

På samme måde tror jeg på, at data scientistens job, som vi kender det i dag, knap vil være til at genkende om fem til ti år. I stedet vil slutbrugere i alle slags økonomiske sektorer arbejde med data science-software på samme måde, som ikke-tekniske medarbejdere arbejder med Excel i dag. Faktisk er disse data science-værktøjer måske kun endnu et faneblad i Excel i 2029.

Finansielle analytikere i dag behøver sjældent at rekruttere data scientists til at hjælpe dem, fordi platformene, de bruger, allerede har de data science-værktøjer, analytikerne behøver.

Dette vil også blive almindeligt på mange andre felter, da en basal forståelse af data science vil blive en påkrævet færdighed i mange job.

Derudover er meget af data science-arbejdet i dag automatiseret, og nogle iagttagere advarer om, at data scientists muligvis automatiserer sig til arbejdsløshed.

Data sciences stigende popularitet

Data science-karrierer oplever lige nu et gyldent øjeblik. En artikel i Bloomberg i 2018 kaldte data science ‘America’s Hottest Job’, og man kunne læse, at der var en 75 pct. forøgelse i data scientist- jobannoncer på rekrutteringswebsitet Indeed.com fra januar 2015 til januar 2018. Data science-doktorater i nogle konsulentfirmaer får lønninger på op til 300.000 dollars, fortalte artiklen.

Imens har dusinvis af amerikanske universiteter lanceret data analytics-programmer. UC Berkeley fik et nyt data science-hovedfag i 2018, og det blev hurtigt et af skolens mest populære hovedfag.

I november lancerede universitetet sin nye ‘Division of Data Science and Information’ i forbindelse med det, de selv kaldte deres ‘største omorganisering i flere årtier’.

Men alle disse unge mennesker går nu ind i en profession, der måske er uigenkendelig om et årti. Mens deres data science-færdigheder vil være en stor karrierefordel, vil en overraskende lille del af dem højst sandsynligt komme til at arbejde i standard data scientist-job.

Fra maskinkode til massekodning til dataautomatisering

Da jeg studerede computer science (datalogi) i tidernes morgen, var compiler-design et obligatorisk fag.

Vi skulle vide, hvordan man konverterer programsprog som C direkte til maskinsprog, den hexadecimale kode, som computere oversætter direkte.

Det var almindeligt at skrive stykker af kommercielle applikationer i maskinsprog for at få tingene til at gå hurtigere.

Over de seneste årtier er flere og flere lag af softwarefunktioner blevet lagt ind i mere udviklede værktøjer.

Størstedelen af kode i dag er i højniveau-sprog, der er lette at lære, som Python, og relativt få programmører behøver at vide, hvordan man skal tale direkte med hardwaren.

Data science er ved at gå samme vej. Over de næste tre til fem år vil værktøjer på et højere niveau stadigt oftere afhjælpe behovet for ekspertise i grundlæggende teknologier som high-performance computing (at sprede et problem over flere CPU’er), data munging (at forberede rå data til analyse), funktionerne i machine learning-systemer eller lavniveau-statistiske metodologier. Alt dette vil blive håndteret af maskinen selv.

I dag introducerer dusinvis af virksomheder - inklusive Trifacta, Element Analytics og Kylo - nye data analytics-værktøjer, mange af dem målrettet kedeligt dataforberedelsesarbejde, så data scientists hurtigere kan komme i gang med det analytiske arbejde.

Der er også flere og flere data science-frameworks, der automatiserer algoritmeudvælgelse og parameter tuning (f.eks. Auto-sklearn, DataRobot). Disse frameworks og værktøjer kombineres med platforme til data management for at skabe byggeklodser til fremtidens dataforbruger.

Vejen frem for data scientists

De kommende år forudser jeg, at data scientists bliver inddelt i mindst fem typer medarbejdere:

1. Generalister: Den første gruppe bliver data science-generalister, som vil fortolke data og gøre den brugbar. Disse generalister vil fokusere på at uddanne slutbrugerne og hjælpe brugere med at stille dataene spørgsmål frem for at finde alle svarene selv. Dette vil højst sandsynligt blive en overgangsrolle, mere almindelig om fem år end om ti.

2. Industrispecialister: Den anden og største gruppe vil bestå af industrispecialister, som vil bruge data science-teknikker specifikke steder såsom produktion, medicinske videnskaber og finans. Her tror jeg, hovedparten af jobbene vil være. Men de vil ikke blive betragtet som data science-job. Denne medarbejder vil ikke være en data scientist, som forstår produktionsarbejdet, men snarere en leder inden for produktionsindustrien, som forstår data science. Man kan sammenligne det med en forsker, som er fantastisk god til statistik.

3. Dybdespecialister: Den tredje og mindste gruppe vil være dybdespecialisterne i specifikke data science-teknologier. Det er her, de resterende rene data science-job vil være. Deres rolle vil være at udføre data science på abstrakt vis, at forbedre algoritmers præstation og designe nye generaliserede tilgange. De vil være som de dataloger, vi har i dag, i og med at de bygger et teoretisk grundlag frem for at løse hverdagsproblemer.

4. Analytics-udviklere: Den fjerde gruppe vil forvandle sig fra data scientists til analytics-udviklere. De er softwareudviklingsspecialister, som håndterer data-interaktion og hjælper folk med at drage konklusioner ud fra datarapporter. Algoritmedesign vil være en lille del af deres job, assisteret af dataplatforme såvel som robuste kodebiblioteker, som vil udføre meget af arbejdet automatisk.

5. Data engineers: Endelig vil der komme nye job, som en data engineer, der bygger systemer, der forvandler og leverer data til grundlæggende platforme, hvor analytics og visualisering finder sted. Mens data scientists ofte anerkendes for deres fantastiske algoritmer, kan op til 80 pct. af en data scientists tid blive brugt på at indsamle, rense og organisere data.

Konklusion

Inden for 10 år vil data science være så viklet ind i industrispecifikke applikationer og brede produktivitetsværktøjer, at vi måske ikke længere tænker på det som en ‘hot’ karriere.

Ligesom generationer af matematik- og statistikstuderende er gået videre til at udfylde alle mulige roller i forretnings- og akademikerverdenen uden at betragte sig selv som matematikere eller statistikere, så vil de nyslåede data scientists være morgendagens produktionsingeniører, markedsføringschefer og forskere inden for medicin.

Dette indlæg er tidligere bragt på Forbes og er genudgivet med forfatterens tilladelse.