Hvilke data skal anvendes?

Arbejdet med predictive analytics for det meste så spændende, at der opstår et brændende ønske om at anvende så mange datakilder som muligt. Men hvis vi allerede er i gang med at udvikle en model, som performer godt, så er marginalnytten af at tilføre flere data ofte begrænset, skriver Kristian Mørk Puggaard.
I Damvad Analytics anvender vi data til mange forskellige formål og i mange forskellige settings. Vi arbejder så forskellige steder som inden for pharma, finans, transport og inden for real estate. I sidste uge fik jeg spørgsmålet om, hvordan vi vurderer de datakilder, som vi bruger i det analytiske arbejde.  
Vil du have fuld adgang til DataTech?

DataTech skriver til dig, der arbejder professionelt med data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra Machine Learning-modeller til dataetik.