Don't miss the train: Methodik

Was wir getan haben und wie wir es getan haben

Dieser Artikel versucht, eine scheinbar einfache Frage zu beantworten: Wie einfach ist es für die Bürger in Europa, mit dem Zug zu reisen, und was erklärt die Unterschiede innerhalb der Länder? In unserem Versuch, diese Frage zu beantworten, wollten wir zwei Kriterien betrachten: Die Entfernungen zu den Bahnhöfen und den Anteil der Menschen, die gut an das Bahnnetz angebunden sind (weniger als 10.000 Schritte bis zu einem Bahnhof), im Vergleich zu den schlecht angebundenen Menschen (mindestens 30.000 Schritte bis zu einem Bahnhof).

Die Entfernungen zu einem Bahnhof zeigen uns, wie weit jemand reisen muss, während das andere Kriterium uns eine Vorstellung davon vermittelt, wie viele Menschen auf ein Auto, einen Bus oder ein Taxi angewiesen sind, um zum Bahnhof zu gelangen. Der Grenzwert von 30.000 Schritten ist willkürlich, basiert aber auf der Annahme, dass man diese Entfernung wahrscheinlich nicht zu Fuß zurücklegt, nur um zu einem Zug zu gelangen.

Wir haben keine offizielle oder inoffizielle Quelle gefunden, die Daten für europäische Länder über Entfernungen zu Bahnhöfen oder Zahlen darüber enthält, wie viele Menschen in der Nähe eines Bahnhofs leben. Das bedeutet, dass wir diese Daten selbst sammeln und erstellen mussten.

Schritt für Schritt haben wir also Folgendes gemacht:

1.    Im Juli 2019 haben wir alle Bahnhöfe aus dem Europäischen Infrastrukturregister (Login erforderlich: https://rinf.era.europa.eu/rinf) heruntergeladen. Die Gesamtzahl der heruntergeladenen Bahnhöfe betrug 29.511.

Das Infrastrukturregister enthielt keine Daten für Irland und die Schweiz. Die Datenqualität für Rumänien und die Niederlande war sehr schlecht. Letzten Endes haben wir Rumänien, Irland und die Schweiz von der Analyse ausgeschlossen. Für die Niederlande haben wir zusätzliche Bahnhöfe aus Wikipedia gesammelt. Auch für Italien und Deutschland haben wir weitere Bahnhöfe aus anderen Quellen hinzugefügt.

2.      Im Oktober 2019 suchten wir im HaCon Fahrplan-Auskunfts-System (HAFAS) nach den Namen der Bahnhöfe und kombinierten die beiden Datenquellen, wenn sie auf den gleichen Bahnhof hinwiesen.

Dieser Schritt entspricht in etwa der Suche nach einem Bahnhof über das Buchungssystem der Deutschen Bahn. Da wir tausende von Bahnhöfen nachschlagen wollten, haben wir dieses verwendet, das an die HAFAS der öffentlichen Verkehrsmittel APIs angebunden ist.

Vereinfacht ausgedrückt suchten wir nach einem Bahnhof-Namen im RINF, und HAFAS lieferte alle ähnlichen Bahnhof-Namen in der Datenbank. Daraufhin wählten wir denjenigen aus, welcher dem RINF- Bahnhof am nächsten lag. Dies war nicht immer offensichtlich. Das Bild unten zeigt den gleichen Bahnhof, aber HAFAS (grün) denkt, dass der Bahnhof an einem anderen Ort liegt als RINF (rot). Die RINF-Koordinaten sind korrekt.

Für jeden RINF-Bahnhof, den HAFAS nicht kannte, haben wir manuell überprüft, ob es sich tatsächlich um einen Bahnhof handelt. Bei einigen war das der Fall, bei anderen nicht. Wir haben dann nur mit Ländern weitergemacht, in denen wir mindestens 90 % der RINF-Bahnhöfe entweder kartografieren oder erklären konnten. Die folgenden Länder wurden in diesem Schritt entfernt: Estland, Lettland, Litauen, Griechenland, Spanien, Norwegen und die Slowakei. Das bedeutet, dass die HAFAS-Daten für diese Länder zu diesem Zeitpunkt besonders schlecht waren

3.      Wir haben nur die Länder aufgenommen, in denen HAFAS eine vollständige Deckung der Zugfahrpläne aufweist.

Wir haben die Deckung geschätzt, indem wir fünf bekannte Zugstrecken pro Land simuliert, und geprüft haben, ob HAFAS wusste, dass man sie mit dem Zug erreichen kann. (Die Strecken sind hier zu sehen.) Nur wenn die Datenbank alle 5 Strecken in einem bestimmten Land erfolgreich als mit dem Zug erreichbar identifiziert hat, haben wir die Analyse für dieses Land fortgesetzt.

Von den 16 Ländern, mit denen wir beim vorherigen Schritt weitergemacht haben, haben wir festgestellt, dass die API alle Strecken korrekt als mit dem Zug erreichbar identifiziert hat.

4.      Wir haben die Bahnhöfe in relevant oder nicht relevant unterteilt. Die Gesamtzahl der relevanten Bahnhöfe betrug 22.852.

Ein relevanter Bahnhof ist nach unserer Auffassung ein Bahnhof, von dem aus man mit dem Zug in die Hauptstadt fahren kann (Umsteigen in andere Züge ist erlaubt). Ein nicht relevanter Bahnhof ist ein Bahnhof, von dem aus man zusätzlich mit dem Auto oder Bus (auch wenn es nur ein Teil der Strecke ist) in die Hauptstadt fahren, oder den Bus nehmen muss.

Wir haben jeden Bahnhof als relevant oder nicht relevant kategorisiert, je nachdem, wie HAFAS bei der Simulation von 25 Fahrten von jedem Bahnhof zum Hauptstadt-Bahnhof des Landes reagiert hat. Alle Bahnhöfe, die nach den Daten von HAFAS nicht relevant waren, haben wir doppelt geprüft und, wenn nötig, manuell (neu) kategorisiert.

Wir haben die Bahnhöfe in den Ländern des Vereinigten Königreichs kategorisiert, je nachdem, ob sie London erreichen können. Deshalb scheint es so, als ob Nordirland keinen Zugang zu Zügen hat.

Wir haben die Bahnhöfe auf Sizilien und Sardinien als relevant eingestuft, weil Informanten meinten, dass der Zug eine machbare Option ist, um von diesen Inseln aus in die Hauptstadt zu fahren, obwohl man auch eine Fähre nehmen muss.

Wir haben manuell weitere Bahnhöfe für Italien (+116), die Niederlande (+11) und Deutschland (+320) hinzugefügt, die entweder in RINF oder HAFAS fehlten.

5.      Für jedes Land haben wir den nächstgelegenen relevanten Bahnhof für jede Person im Land gefunden.

Wir zeichneten schnurgerade Linien zwischen allen Quadraten in einem 1x1 km Bevölkerungsraster und allen relevanten Bahnhöfen in einem bestimmten Land und klassifizierten die kürzeste Linie als den nächstgelegenen Bahnhof.

Allgemeine Probleme mit der Qualität unserer Daten

Wir haben keine offene internationale oder regionale Quelle gefunden, weder privat noch anderen Ursprungs, die eine vollständige Liste von Bahnhöfen in ganz Europa enthält. Wenn Sie sich für das Thema Bahnhöfe interessieren, bleiben Ihnen aus unserer Sicht vier Alternativen:

-       HAFAS (HaCon Fahrplan-Auskunfts-System),

-       RINF (Europäisches Infrastruktur-Register),

-       nationale Behörden,

-       oder eine der zahlreichen Listen, die online gefunden werden können.

HAFAS ist ein Buchungssystem, das von der privaten Siemens-Tochter Hannover Consulting entwickelt wurde. Der Vorteil von HAFAS ist, dass es von ziemlich vielen großen Transportunternehmen in Europa auf ihren Buchungs-Webseiten genutzt wird. Der Nachteil ist, dass es geschützt ist und das Unternehmen die Liste der Bahnhöfe nicht veröffentlicht. Man muss seine eigene erstellen. Dies war für uns keine machbare Option, und wie wir erkannt haben, ist die Qualität der Daten in HAFAS ist manchmal schlecht. Nicht nur, dass in manchen Ländern ganze Regionen fehlen, sondern auch die Lage der Bahnhöfe ist manchmal völlig unbrauchbar.

Das Europäische Infrastrukturregister wird von der Europäischen Eisenbahnagentur (European Railway Agency) geführt, und jeder Mitgliedstaat (sowie Norwegen und die Schweiz) soll Bahnhöfe (und andere eisenbahnrelevante Informationen) an die Datenbank melden. Das RINF ist, soweit wir es verstehen, die vollständigste offizielle Liste von Bahnhöfen in ganz Europa. Wir haben festgestellt, dass das RINF das Beste ist, was wir tun können, ohne alle Staaten einzeln anzusprechen. Im Nachhinein haben wir festgestellt, dass die Erfassung von Privatbahnen in einigen Ländern weniger wahrscheinlich in das RINF aufgenommen wird. Mehr über das RINF können Sie hier lesen.

Crowdgesourcte Listen sind keine schlechte Alternative, aber da wir überprüfen wollten, ob man von einem bestimmten Bahnhof aus reisen kann, haben wir uns auf den Namen und die Koordinaten verlassen, um eine andere Quelle (in unserem Fall HAFAS) zu finden, weshalb wir uns entschieden haben, dass eine offizielle Quelle geeigneter ist.

Ein weiteres Problem mit unseren Daten ist, dass das Bevölkerungs-Raster, das wir zur Darstellung der Menschen in Europa verwenden, aus dem Jahr 2011 stammt. Zweifellos ist die Bevölkerung seitdem gestiegen und die Länder haben sich stärker urbanisiert, aber es ist das jüngste verfügbare Raster.

Notizen

  • Die folgenden Orte wurden von der Analyse ausgeschlossen, obwohl sie zu den von uns analysierten Ländern gehören oder mit ihnen verbunden sind. Korsika (Frankreich), Bornholm (Dänemark), Nordirland (Vereinigtes Königreich), Isle of Wight (Vereinigtes Königreich), Orkney (Vereinigtes Königreich), Shetland (Vereinigtes Königreich), Westliche Inseln (Vereinigtes Königreich), Åland (Finnland), Azoren (Portugal), Madeira (Portugal) und Gotland (Schweden). Wir haben diese Gebiete ausgeschlossen, weil sie nicht mit dem Festland verbunden sind, wo das Endziel liegt. Es gibt andere besiedelte Inseln, die in unseren Ergebnissen enthalten sind, z.B. Lampedusa (Italien) und Helgoland (Deutschland).
  • Alle Bahnhöfe der neuen dänischen Stadtbahn Letbanen waren zum Zeitpunkt unserer Untersuchung noch nicht in den europäischen Bahnhofs-Daten enthalten.

Häufig gestellte Fragen (FAQ)

Wie wurden die Schritte berechnet?

Km / 1.6 * 1975 (Quelle )

Wie wurde bestimmt, ob ein Gebiet städtisch, ländlich oder dazwischenliegend ist?

Wir haben alle Bevölkerungsquadrate auf NUTS3-Regionen abgebildet und dann jedes Quadrat auf der entsprechenden NUTS3-Typologie abgebildet, wie sie von Eurostat hier definiert wurde.

Sind wir uns sicher, dass das europäische Infrastrukturregister alle Bahnhöfe in ganz Europa enthält?

Nein. Tatsächlich wissen wir, dass dem Register viele rumänische und niederländische Bahnhöfe fehlten, als wir die Daten exportierten. Wir wissen auch, dass die RINF-Daten viele Bahnhöfe enthielten, die nicht mehr benutzt werden. Der Vergleich der RINF-Daten mit HAFAS ermöglichte es uns, so viele Falschmeldungen wie möglich auszuschließen. Aber wir wissen nicht mit absoluter Sicherheit, ob wir alle relevanten Bahnhöfe gefunden haben. Im Gegenteil: Es ist eher wahrscheinlich, dass wir einige übersehen haben. Wir haben weitere Bahnhöfe aus anderen Quellen für die Niederlande, Deutschland und Italien hinzugefügt.

Ist ein RINF-Bahnhof immer dem richtigen HAFAS-Bahnhof zugeordnet?

Nein. Aber er wird einem HAFAS-Bahnhof mit ähnlichem Namen zugeordnet, der im Umkreis von 500 Metern liegt, was in der Regel bedeutet, dass es sich um denselben Bahnhof handelt. Solche Abweichungen gibt es zwar, aber sie sind geringfügig und haben keinen Einfluss auf die Analyse.

Ist sicher, dass HAFAS für alle Bahnhöfe korrekte und aktualisierte Fahrpläne hat?

Nein. Wir gehen davon aus, dass HAFAS richtig liegt, wenn es behauptet, dass man von einem Bahnhof aus mit der Bahn fahren kann. Wir gehen auch davon aus, dass HAFAS falsch liegt, wenn es behauptet, dass man von einem Bahnhof nicht mit dem Zug fahren kann. Deshalb haben wir alle Bahnhöfe, für die wir solche Antworten von HAFAS erhalten haben, manuell überprüft und (wenn nötig) neu kategorisiert.

Wie wurden die Entfernungen gemessen?

Per Luftlinie.

Einige Menschen leben an der Grenze zu einem EU-Nachbarland. Warum wurde nicht zugelassen, dass ein Bahnhof auf der anderen Seite der Grenze relevant ist?

Die Daten erlauben keine grenzüberschreitende Analyse, da wir nicht genügend Daten für ausreichend viele Länder haben.

Wurden S-Bahnen und Vorort-Bahnhöfe berücksichtigt (z.B. S-Bahn, Pendeltåg usw.)?

Wir haben die Züge oder Bahnhöfe nicht nach der Art des Verkehrs (transnational, national, regional oder vorstädtisch) kategorisiert. Das bedeutet, dass in einigen Fällen Vorortzüge enthalten sind und in anderen Fällen nicht. Da wir Fahrten zu jedem beliebigen Bahnhof in der Hauptstadt simuliert haben, können wir davon ausgehen, dass die Vorortzüge vor allem die Entfernungen in den NUTS3-Regionen der Hauptstadt beeinflussen.

Ist es möglich, dass ein Bahnhof wegen vorübergehender Verkehrssperren als nicht relevant eingestuft wurde?

Ja, aber das ist unwahrscheinlich. Für jeden Bahnhof, der zunächst als nicht relevant eingestuft wurde, haben wir die Klassifizierung doppelt überprüft, indem wir auf der nationalen Buchungswebsite nach einer Reise in die Hauptstadt mit unterschiedlichen Abfahrtsdaten gesucht haben. Dabei stellten wir beispielsweise fest, dass in Dänemark viel Schienenarbeit anfiel, die unsere Daten verzerrte, was wir durch eine Neukategorisierung der Bahnhöfe als relevant behoben haben. Längere Aussetzungen des Verkehrs (+1 Monat) können jedoch Auswirkungen haben, die uns nicht bekannt sind, da einige Buchungsseiten keine Suche nach einer weiterführenden Reise erlauben.

Design

Sheldon.studio took care of the design of the main article of the investigation together with OBC Transeuropa: here Sheldon's Matteo Moretti shares some reflections on the choices that drove their project.

"Verfügbare Übersetzungen
Mittwoch, 18. Dezember 2019

Quelle/n:

Journalism++
share subcribe newsletter