Dataanalyse i naturligt sprog: »Hvis det kræver en manual, har vi fejlet«

Foto : VectorKnight/Bigstock

Dataanalyse i naturligt sprog: »Hvis det kræver en manual, har vi fejlet«

Muligheden for at lave dataforespørgsler i naturligt sprog er på vej til at blive standard i analysesoftware. Sprogets tvetydighed er både en styrke og en svaghed, mener softwareingeniør hos Tableaus Ryan Atallah. 
Hvilket produkt sælger bedst i Europa? Hvilke jordskælv har været mest dødelige? Hvor i verden var temperaturen højest i maj? De spørgsmål, som brugere har til data, opstår sjældent som fuldendte SQL-queries. Men det kræver som oftest teknisk forståelse af data og analyseværktøjer at få svarene ud af tabellerne. 
Vil du have fuld adgang til DataTech?

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra Machine Learning-modeller til dataetik.

Nævnte firmaer

Ryan Atallah
Ryan Atallah
Illustration: Ryan Atallah

Ryan Atallah er udannet datalog fra Stanford University og har nu titel af Staff Software Engineer hos Tableau. I 2014 grundlagde Ryan Atallah ClearGraph, som han var CTO for, indtil selskabet sidste år blev købt af Tableau.  

NLP vs. NLG vs. NLU

Natural Language Processing - NLP - er, hvad der sker, når en computer læser tekst i naturligt sprog og omsætter tekst til struktureret data. 

Natural Language Generation - NLG - er, hvad der sker, når en computer skriver tekst i naturligt sprog ved at omsætte struktureret data til tekst. 

Natural Language Understanding - NLU - er computerens evne til at forstå intentionen, der formidles i naturligt sprog. Men NLP kan være noget så simpelt som at spotte bandeord, kan NLU bedre beskrive, hvad digitale assistenter som Alexa og Siri foretager sig. 

Kilde: Narrative Science