Startup gør prætrænet model til dansk talegenkendelse åben: I fællesskab kan vi lave endnu bedre version

sprog nlp
Illustration: designer491, bigstock. Se større version
Det næste store skridt bliver en version med 10 eller 100 gange mere træningsdata, siger startup bag modellen.
Løsninger11. januar kl. 03:11

Danmark har fået en ny sprogmodel, som kan bruges til at udvikle taleteknologi. I december lancerede den nystartede virksomhed Alvenir en wav2vec2 model, der kan fintunes til dansk talegenkendelse og slår de internationale modeller med længder.

»Hvis vi sammenligner os med Google i et bredt generelt brugsscenarie er vi ca. oppe på dobbelt performance på dansk,« fortæller Martin Carsten Nielsen, der sammen med Rasmus Arpe Fogh Egebæk udgør Alvenir.

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik. Få tilsendt tilbud

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Log ind for at deltage i den videnskabelige debat.