August
30

Hybrides Format

Auswirkungen der Zuweisung von Nationalitäten zu Namen mithilfe von maschinellem Lernen auf die wissenschaftlichen Migrationsraten weltweit

Faeze Ghorbanpour
Abteilung Digitale und Computergestützte Demografie, 30. August 2023

Hybrid Seminar Talk, August 30 from 11am to 12pm (CEST)

Abstract

Im Gegensatz zu Registerdaten enthalten Beobachtungs- und digitale Spurendaten in der Regel keine Angaben zur Nationalität von Personen. Die Ermittlung der Nationalität von Personen spielt eine Schlüsselrolle bei der Entwicklung fairer und datenschutzfreundlicher Modelle für maschinelles Lernen. Sie ermöglicht die Beantwortung wichtiger Fragen in der Demografie und den Sozialwissenschaften. Unser Ziel war es, die Nationalität mit den am wenigsten verfügbaren Daten, nämlich den vollständigen Namen der Personen, zu ermitteln. Wir haben 3 Millionen Name-Nationalität-Paare aus Wikipedia gesammelt. Wir wendeten char-basierte maschinelle Lernmodelle an, um diese Namen in Nationalitätenfamilien wie Deutsch, Spanisch und Englisch, um nur einige zu nennen, zu kategorisieren. Diese Kategorisierung umfasst drei Granularitätsebenen, von allgemeineren geografischen Regionen bis hin zu Länderregionen. Unser Modell übertrifft die Leistung der in der Literatur diskutierten Modelle und zeigt eine Verbesserung von 10 % in Bezug auf den gewichteten f1-Score. Um die Migrationsraten unter den Scopus-Autoren auf globaler Ebene zu analysieren, haben wir die zugewiesenen Nationalitäten verwendet. Die Ergebnisse unserer Analyse zeigen, dass dieser Ansatz wertvolle Einblicke in die Verschiebungen der Migrationsraten liefert, wenn das Herkunftsland auf der Grundlage der Autorennamen statt der früher verwendeten akademischen Zugehörigkeit als Land der "akademischen Geburt" betrachtet wird.

Über die Sprecherin

 

Das Max-Planck-Institut für demografische Forschung (MPIDR) in Rostock ist eines der international führenden Zentren für Bevölkerungswissenschaft. Es gehört zur Max-Planck-Gesellschaft, einer der weltweit renommiertesten Forschungsgemeinschaften.