12. März 2025 | News | Leseempfehlung
Online-Genealogien für die demografische Forschung - Potenzielle Vorteile und Fallstricke
Andrea Colasurdo vom Max-Planck-Institut für demografische Forschung (MPIDR) und Riccardo Omenti von der Università di Bologna haben in einer aktuellen Studie die potenziellen Vorteile und Fallstricke bei der Nutzung von Online-Genealogien für die demografische Forschung untersucht. Am Beispiel der FamiLinx-Datenbank untersuchten sie, wie sich die Vollständigkeit und Qualität der demografischen Informationen in Online-Genealogiedaten auf deren Nutzbarkeit auswirken.

© Irina – stock.adobe.com
„Mit unserer Analyse wollten wir neue Maßnahmen identifizieren und vorschlagen, um die Vollständigkeit und Qualität der demografischen Variablen in den FamiLinx-Daten sowohl auf individueller als auch auf Familienebene für den Zeitraum von 1600 bis 1900 zu bewerten“, erklärt Colasurdo. Für die Studie wählten die Forscher Schweden als Testland und analysierten, inwieweit die aus FamiLinx extrahierte Alters- und Geschlechtsverteilung sowie die Sterblichkeitsraten der digitalen Bevölkerung von denen der registrierten Bevölkerung abweichen. „Wir haben uns gefragt: Gibt es Häufungen von Vollständigkeit und Qualität innerhalb ausgewählter Verwandtschaftsnetzwerke? Wie werden Alters- und Geschlechtsverteilungen und demografische Schätzungen, die aus Populationen von Online-Genealogien abgeleitet werden, von der Vollständigkeit und Qualität der gemeldeten demografischen Informationen beeinflusst?“, so der Wissenschaftler.

Die Abbildung zeigt die prozentualen Unterschiede in der Alters- und Geschlechterverteilung zwischen der aus FamiLinx extrahierten schwedischen genealogischen Bevölkerung und der registrierten schwedischen Bevölkerung für vier Kalenderjahre: 1751, 1800, 1850 und 1900. © MPIDR
Colasurdo und Omenti kommen zu dem Schluss, dass fehlende Werte und die Genauigkeit der demografischen Informationen in FamiLinx selektiv sind. Wenn eine demografische Variable verfügbar ist, können Forschende die Verfügbarkeit anderer demografischer Informationen effektiv vorhersagen. Die Vollständigkeit und Qualität der demografischen Variablen innerhalb von Verwandtschaftsnetzwerken ist bei Personen mit vollständigeren und genaueren demografischen Informationen deutlich höher. Die Populationen von FamiLinx weisen niedrigere Sterblichkeitsraten auf als die registrierte Bevölkerung, und ihre Repräsentativität verbessert sich gegen Ende des 19. Jahrhunderts.
Die Studie zeigt, dass Online-Genealogien eine vielversprechende Datenquelle für die demografische Forschung sind, dass ihre Nützlichkeit in der Demografie jedoch von der Qualität und Vollständigkeit der gesammelten demografischen Informationen und ihrer Selektivität abhängt. „Wir ermutigen Wissenschaftler*innen, die FamiLinx-Daten mit Vorsicht zu verwenden. Die Datenquelle bietet viele Möglichkeiten für die demografische Forschung, insbesondere in der historischen Demografie. Die Grenzen genealogischer Online-Daten müssen jedoch durch die Anwendung geeigneter Methoden zur Korrektur von Verzerrungen und durch eine sorgfältige Stichprobenauswahl angegangen werden“, so Omenti.
Originalpublikation
Colasurdo, A.; Omenti, R.:
Demographic Research 51:41, 1299–1350. (2024)

Keywords
Vollständigkeit, Datenqualität, digitale Daten, FamiLinx, Genealogie, Verwandtschaftsnetzwerk