12. März 2025 | News | Leseempfehlung

Online-Genealogien für die demografische Forschung - Potenzielle Vorteile und Fallstricke

Andrea Colasurdo vom Max-Planck-Institut für demografische Forschung (MPIDR) und Riccardo Omenti von der Università di Bologna haben in einer aktuellen Studie die potenziellen Vorteile und Fallstricke bei der Nutzung von Online-Genealogien für die demografische Forschung untersucht. Am Beispiel der FamiLinx-Datenbank untersuchten sie, wie sich die Vollständigkeit und Qualität der demografischen Informationen in Online-Genealogiedaten auf deren Nutzbarkeit auswirken.

© Irina – stock.adobe.com

„Mit unserer Analyse wollten wir neue Maßnahmen identifizieren und vorschlagen, um die Vollständigkeit und Qualität der demografischen Variablen in den FamiLinx-Daten sowohl auf individueller als auch auf Familienebene für den Zeitraum von 1600 bis 1900 zu bewerten“, erklärt Colasurdo. Für die Studie wählten die Forscher Schweden als Testland und analysierten, inwieweit die aus FamiLinx extrahierte Alters- und Geschlechtsverteilung sowie die Sterblichkeitsraten der digitalen Bevölkerung von denen der registrierten Bevölkerung abweichen. „Wir haben uns gefragt: Gibt es Häufungen von Vollständigkeit und Qualität innerhalb ausgewählter Verwandtschaftsnetzwerke? Wie werden Alters- und Geschlechtsverteilungen und demografische Schätzungen, die aus Populationen von Online-Genealogien abgeleitet werden, von der Vollständigkeit und Qualität der gemeldeten demografischen Informationen beeinflusst?“, so der Wissenschaftler.

Die Abbildung zeigt die prozentualen Unterschiede in der Alters- und Geschlechterverteilung zwischen der aus FamiLinx extrahierten schwedischen genealogischen Bevölkerung und der registrierten schwedischen Bevölkerung für vier Kalenderjahre: 1751, 1800, 1850 und 1900. © MPIDR

Colasurdo und Omenti kommen zu dem Schluss, dass fehlende Werte und die Genauigkeit der demografischen Informationen in FamiLinx selektiv sind. Wenn eine demografische Variable verfügbar ist, können Forschende die Verfügbarkeit anderer demografischer Informationen effektiv vorhersagen. Die Vollständigkeit und Qualität der demografischen Variablen innerhalb von Verwandtschaftsnetzwerken ist bei Personen mit vollständigeren und genaueren demografischen Informationen deutlich höher. Die Populationen von FamiLinx weisen niedrigere Sterblichkeitsraten auf als die registrierte Bevölkerung, und ihre Repräsentativität verbessert sich gegen Ende des 19. Jahrhunderts.

Die Studie zeigt, dass Online-Genealogien eine vielversprechende Datenquelle für die demografische Forschung sind, dass ihre Nützlichkeit in der Demografie jedoch von der Qualität und Vollständigkeit der gesammelten demografischen Informationen und ihrer Selektivität abhängt. „Wir ermutigen Wissenschaftler*innen, die FamiLinx-Daten mit Vorsicht zu verwenden. Die Datenquelle bietet viele Möglichkeiten für die demografische Forschung, insbesondere in der historischen Demografie. Die Grenzen genealogischer Online-Daten müssen jedoch durch die Anwendung geeigneter Methoden zur Korrektur von Verzerrungen und durch eine sorgfältige Stichprobenauswahl angegangen werden“, so Omenti.

Originalpublikation

Colasurdo, A.; Omenti, R.:
Demographic Research 51:41, 1299–1350. (2024)       

Keywords

Vollständigkeit, Datenqualität, digitale Daten, FamiLinx, Genealogie, Verwandtschaftsnetzwerk

Kontakt

Leiterin des Arbeitsbereichs Öffentlichkeitsarbeit und Veranstaltungsorganisation

Silvia Leek

E-Mail

+49 381 2081-143

Redakteurin Wissenschaftskommunikation

Christine Ruhland

E-Mail

+49 381 2081-157

Redakteurin Wissenschaftskommunikation

Silke Schulz

E-Mail

+49 381 2081-153

Was nun?

Zur Startseite

Das Max-Planck-Institut für demografische Forschung (MPIDR) in Rostock ist eines der international führenden Zentren für Bevölkerungswissenschaft. Es gehört zur Max-Planck-Gesellschaft, einer der weltweit renommiertesten Forschungsgemeinschaften.