Ekstra Bladet frigiver open source-værktøj til at bygge NLP-modeller med minimum kode

NERDA
Illustration: NERDA, Ekstra Bladet.
Med Python-pakken NERDA fra Ekstra Bladet kan du nemt selv vælge transformer-arkitektur.
Tech fokus28. januar 2021 kl. 04:49
errorÆldre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Den relativt korte liste af danske sprogmodeller, som er tilgængelige for alle, er blevet et navn rigere. 

NERDA (Named Entity Recognition for DAnish) er navnet på en ny Python-pakke, der netop er blevet gjort open source af Ekstra Bladet. 

Pakken tæller flere prætrænede modeller til Named-entity Recognition (NER) - altså Natural Language Processing-opgaven med at finde blandt andet navne, organisationer og steder i tekst - bygget med Huggingface Transformers og PyTorch. 

Men NERDA giver også et værktøj, så man kan træne og fintune sin egen NERDA-model på egen data, hvis man ønsker det.

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik. Få tilsendt tilbud

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Log ind for at deltage i debatten.
settingsDebatindstillinger