Startup bygger åbent værktøj, så alle kan bygge balancerede datasæt syntetisk

fake kopi original
Illustration: Pixelvario, bigstock. Se større version
Hvis det er en tidskrævende proces, at dele data internt, kan syntetisk data være vejen frem.
Løsninger1. juni 2021 kl. 03:48
errorÆldre end 30 dage

Privacy og compliance, ventetid på data og ubalancerede datasæt. Hos det amerikanske startup Gretel.AI ser man syntestisk data, som løsningen på en lang række hovedpiner, som kan stikke en kæp i hjulet på data science-projekter i dag. 

Selskabet er gået i beta med en platform og et open source bibliotek, der lader alle producerer kunstige versioner af ægte datasæt. Og målet er på sigt, at selskaber uden frygt kan dele syntetiske versioner af selv de mest sensitive data, fortæller medstifter og CEO Alex Watson. 

»Vi sigter efter, at man ikke behøver at være ekspert i sprogmodeller, syntetisk data, differential privacy for at lave syntetisk modeller, som du kan bruge fra dag et,« forklarer han. 

Alex Watson har tidligere lavet selskabet Harvest.ai, som blev købt af Amazon. Og her opstod ideen til Gretel. 

Få fuld adgang til DataTech

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik. Få tilsendt tilbud

Abonnementsfordele
vpn_key
Fuld adgang til DataTech
Alt indhold på DataTech er åbent for dig, så du kan nyde det fra din computer, tablet eller mobil.
drafts
Kuraterede nyhedsbreve
Nyheder, interviews, tendenshistorier og meget mere, leveret til din indbakke.
thumb_up
Adgang til debatten
Deltag i debatten med andre professionelle.
Debatten
Log ind for at deltage i den videnskabelige debat.