Connecting different sources of health data can enhance the development of new treatments. In this article, the authors discuss the challenges and solutions to use such data to improve variable selection.
Een voorwaarde voor een correcte schatting van een effect is dat alle relevante factoren zijn meegenomen in de analyse. Wanneer er een factor is weggelaten, zullen de schattingen van een effect vertekend zijn. Bijvoorbeeld in een analyse naar de effectiviteit van een medicijn, kan een vergeten factor ertoe leiden dat een medicijn veel effectiever lijkt dan werkelijk het geval is. Echter, als onderzoeker heb je niet altijd alle relevante factoren tot je beschikking. In zo’n situatie kan een onderzoeker ervoor kiezen om de data van bijvoorbeeld het Centraal Bureau voor de Statistiek (CBS) te koppelen aan de data van de onderzoeker om op deze manier meer relevante factoren op te nemen in de analyse. Om zo’n koppeling tot stand te brengen moet er eerst een aantal hobbels worden genomen. In dit artikel zullen de uitdagingen en oplossingen worden besproken.
Interested? Read the article here.
STAtOR 2019 Issue 3 Pages 12-16
Lianne Ippel is postdoc bij het Institute of Data Science aan de Universiteit Maastricht.
E-mail: lianne.ippel@maastrichtuniversity.nl
Johan van Soest is postdoc bij het Institute of Data Science aan de Universiteit Maastricht en bij Department of Radiation Oncology (MAASTRO), GROW School for Oncology and Developmental Biology, Maastricht UniversityMedical Centre.
E-mail: johan.vansoest@maastrichtuniversity.nl