Facebook skaber talegenkendelse fra 10-minutters lydbid, robotter slår Sydkorea i curling og MIT skaber billeder fra tekst

Foto : Datatech/AI2 Computer Vision Explorer

Facebook skaber talegenkendelse fra 10-minutters lydbid, robotter slår Sydkorea i curling og MIT skaber billeder fra tekst

Vi ser tilbage på ugen, der gik.
Et problem med talegenkendelse er, at dagens algoritmer kræver store mængder transskriberet tale. Men nu har Facebook udsendt algoritmen Wav2vec 2.0, der gør op med den situation. I en tweet skriver forskerne bag artiklen, at den nye algoritme kan klare sig med blot 10 minutters transskriberet tale.
Vil du have fuld adgang til DataTech?

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra Machine Learning-modeller til dataetik.