Migrationsforschung über E-Mail-Daten

Die Demografie entdeckt neue Methoden

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Menschen sind beweglicher als Behörden, sie reagieren schneller auf neue Anforderungen durch veränderte Lebensbedingungen als der behäbige Apparat; obendrein werden Meldungen an Behörden gerne aufgeschoben. Das allgemeine Phänomen zeigt sich besonders am Beispiel der Migrationsströme. “Wo Schätzungen internationaler Migration existieren, sind sie oft veraltet und stimmen kaum miteinander überein”, stellt Emilio Zagheni, vom Arbeitsbereich Ökonomische und Soziale Demografie des Max-Planck-Instituts für demografische Forschung (MPIDR) fest.

Migranten würden dazu tendieren, sich nach einem Umzug „ amtlich nicht oder erst sehr spät neu anzumelden“, auf offizielle Wanderungszahlen sei daher wenig Verlass, sie seien „problematisch“. Dazu kämen Unstimmigkeiten in der Definition dessen, wann jemand überhaupt als Migrant definiert wird.

Aus dieser Problematik heraus haben die Forscher des MPIDR sich an ein Medium gewandt, dass die Bewegung der Individuen quasi von Fingerspitzen weg erfasst, ohne behördliche Erfassungsformulare, mit weltweiter Reichweite - das Netz: Für ihre Studie werteten sie den E-Mail-Verkehr von 43 Millionen Benutzerkonten bei Yahoo aus, im Zeitraum von September 2009 bis Juni 2011. Aufgrund der IP-Adressen wurde der Wohnort der Absender ermittelt und damit etwaige Ortsveränderungen:

For each message, we know the date when it was sent and the geographic location from where it was sent. In addition, we could link the message with the person who sent it, and with the user’s demographic information (date of birth and gender), that was self reported when he or she signed up for a Yahoo! account. We estimated the geographic location from where each email message was sent using the IP address of the user.

Falsche Angaben (Adresse, Alter, Geschlecht), die beim Anlegen von Mailaccounts nicht ungewöhnlich sind, stellten laut Verfasser kein Problem dar. Ihre Überzeugung nach korrigiert die schiere Menge der Daten solche Abweichungen: „Although it is likely that some users reported false informationabout their age and gender, we believe that the large majority of users reported true and accurate information.“ Dass die überwiegende Mehrheit nach dieser Auffassung verlässliche Angaben macht, würde sich laut Studie bei internen Daten-Konsistenzprüfungen und anderen Verifikationen bestätigen.

Veränderte eine Person den Wohnort dauerhaft, was sich dadurch bemerkbar machte, dass ihre Mails von dort verschickt wurden, dann wurde sie als Migrant gezählt. Als Plus dieser Studie führen die Verfasser auf, dass sie damit weltweite Bewegungen aufspüren, während ein großer Teil der herkömmlichen Erforschung von Mobilität sich meist auf ein Land oder eine Region konzentriere – und den relativ großen Beobachtungszeitraum.

Die Ergebnisse sind bei dieser Studie, wie man aus dem zehnseitigen Papier dazu herauslesen kann, nicht das Hauptaugenmerk, sondern vielmehr die Möglichkeiten, die mit dem Forschungsansatz verbunden sind. Im Kern bestätigte die Auswertung der E-Mail-Daten, was als Phänomen nicht neu ist: Dass Wirtschaftskrisen Phasen stärkerer Mobilität und Abwanderungsbewegungen einläuten. In den USA war dies besonders in den Jahren von 2009 und 2010 bemerkbar (siehe dazu die Grafik hier). Als auffällig neues Phänomen wird bemerkt, wozu intuitiven, subjektiven Annahmen nicht führen, dass die Migration von Frauen stärker angestiegen ist.

Im Mittelpunkt dieses Forschungsprojekts stand offensichtlich die Methodik mit Datenströmen aus dem Netz wichtigen demografischen Bewegungen auf die Spur zu kommen. Die Wissenschaftler vom MPIDR zeigen sich beinahe enthusiastisch, welche Felder sich da auftun. So wird die Idee erwähnt, dass man mittels Auswertung von Twitter-Kommunikation Reaktionen auf ein Unglück wie Fukushima auswerten könne. Weil die Inhalte dieser Kommunikationsform anders als beim E-Mail öffentlich sind, wäre auch noch eine inhaltliche Dimension gegeben.

Da die Ergebnisse, die man aus der Auswertung der E-Mail-Daten gewonnen hat, als zuverlässig erwiesen haben, wenn mans ie mit Daten von anderen Erhebungen verglichen hat, setzt man einiges Vertrauen in den neue Forschungsansatz. Beim Thema Migration habe das ganz praktische Konsequenzen:

The use of digital records for demographic research has the potential to become particularly important for developing countries, where the diffusion of Internet will be faster than the development of mature demographic registration systems. (...)in most developing countries, registration systems are not even in place. The work that we present in this article has the potential to transform the way in which migration statistics are compiled.