Don't miss the train: Méthodologie

Ce que nous avons fait et comment nous l’avons fait

Cet article tente de répondre à une question apparemment simple : dans quelle mesure les citoyens européens peuvent-ils facilement prendre le train et qu’est-ce qui explique les différences au sein des pays ? Pour essayer de répondre à cette question, nous avons examiné deux critères objectifs : la distance jusqu’aux gares et la proportion de personnes bien connectées au réseau ferroviaire (moins de 10 000 pas jusqu’à une gare) par rapport à celles qui sont mal connectées (plus de 30 000 pas jusqu’à une gare).

L’éloignement de la gare la plus proche nous indique la distance à parcourir tandis que l’autre mesure nous donne une idée du nombre de personnes qui doivent prendre une voiture, un autobus ou un taxi pour se rendre à la gare. La limite de 30 000 pas est arbitraire, mais basée sur l’hypothèse que vous n’êtes pas susceptible de parcourir cette distance juste pour prendre le train.

Nous n’avons trouvé aucune source, officielle ou non, contenant des données pour les pays européens sur les distances jusqu’aux gares ou des chiffres sur le nombre de personnes vivant à proximité d’une gare. Cela signifie que nous avons dû rassembler ces données nous-mêmes.

Étape par étape, voici ce que nous avons fait:

1. En juillet 2019, nous avons téléchargé toutes les gares du Registre européen des infrastructures (RINF, nécessite une connexion). Le nombre total de gares téléchargées était de 29511.

Le registre des infrastructures ne contenait pas de données pour l’Irlande et la Suisse. La qualité des données pour la Roumanie et les Pays-Bas était très médiocre. Nous avons fini par exclure la Roumanie, l’Irlande et la Suisse de l’analyse. Pour les Pays-Bas, nous avons recherché des gares supplémentaires à partir de Wikipédia. Nous avons également eu recours à d’autres sources pour intégrer plus de gares en Italie et en Allemagne.

2. En octobre 2019, nous avons recherché le nom des gares du système HaCon Fahrplan-Auskunfts (HAFAS) et combiné les deux sources de données lorsqu’elles pointaient vers la même gare.

Cette étape équivaut à peu près à la recherche d’une gare à l’aide du système de réservation de la Deutsche-Bahn . Comme nous voulions rechercher des milliers de gares, nous avons utilisé ce client qui se connecte aux API de transport public HAFAS.

Pour le dire simplement, nous avons recherché un nom de gare dans le RINF, le client HAFAS a renvoyé tous les noms de gares similaires dans la base de données et nous avons sélectionné celle qui se trouvait le plus près de la gare du RINF. Cela n’a pas toujours été évident.

Pour chaque gare du RINF que HAFAS ne connaissait pas, nous avons vérifié manuellement s’il s’agissait bien de gares. Certaines l’étaient et d’autres non. Nous avons continué avec les pays où il était possible de cartographier ou d’expliquer au moins 90% des gares du RINF. Les pays suivants ont été exclus à cette étape : Estonie, Lettonie, Lituanie, Grèce, Espagne, Norvège et Slovaquie. Cela signifie que les données HAFAS pour ces pays étaient particulièrement insuffisantes à l’époque.

3. Nous avons inclus uniquement les pays où HAFAS avait une couverture complète sur les horaires des trains.

Nous avons estimé la couverture en simulant cinq itinéraires de train connus par pays, en vérifiant si HAFAS était en mesure de voir que vous pouviez les effectuer en train (les itinéraires peuvent être consultés ici ). Si la base de données réussissait à identifier les cinq itinéraires dans un pays donné comme pouvant être faits en train, nous poursuivions l’analyse de ce pays.

Sur les 16 pays identifiés au cours de l’étape précédente, nous avons établi que l’API identifiait correctement tous les itinéraires disponibles en train.

4. Nous avons classé les gares comme pertinentes ou non. Le nombre total de gares concernées était de 22 852.

Selon nous, une gare pertinente est une gare à partir de laquelle vous pouvez prendre le train pour aller jusqu’à la capitale (le cas échéant avec des correspondances). Une gare non pertinente est une gare à partir de laquelle vous devez prendre la route (voiture ou bus) pour aller jusqu’à la capitale (même si ce n’est qu’une partie de l’itinéraire)

Nous avons classé chaque gare comme pertinente ou non pertinente, en fonction de la réponse de HAFAS lors de la simulation de 25 trajets de chaque gare jusqu’à la capitale du pays. Nous avons revérifié et, si nécessaire, reclassé manuellement toutes les gares qui, selon les données de HAFAS, n’étaient pas pertinentes.

Nous avons classé les gares de Sicile et de Sardaigne comme pertinentes, car les partenaires ont suggéré que le train était une option viable pour se rendre à la capitale depuis ces îles, même si vous devez également prendre un ferry. Nous avons ajouté manuellement d’autres gares pour l’Italie (+116), les Pays-Bas (+11) et l’Allemagne (+320) qui manquaient au RINF ou à HAFAS.

5. Pour chaque pays, nous avons identifié la gare la plus proche pour chaque habitant.

Nous avons tracé des lignes à vol d’oiseau entre tous les carrés d’une grille de population de 1x1 km avec toutes les gares pertinentes dans un pays donné et retenu la ligne la plus courte pour déterminer la gare la plus proche.

Problèmes généraux liés à la qualité de nos données

Nous n’avons trouvé aucune source internationale ou régionale ouverte, privée ou autre, contenant une liste exhaustive des gares à travers l’Europe. Si vous êtes intéressé par ce sujet, vous disposez, comme nous l’avons vu plus haut, de quatre alternatives : HAFAS (HaCon Fahrplan-Auskunfts-System), RINF (Registre européen des infrastructures), les autorités nationales ou l’une des listes issues de contributions participatives du public disponibles en ligne.

HAFAS est un système de réservation développé par Hannover Consulting, filiale privée de Siemens. L’avantage de HAFAS est que bon nombre de grands transporteurs dans les pays européens l’utilisent sur leurs sites de réservation. L’inconvénient est qu’il est privé et que la société ne publie pas sa liste de gares - vous devez créer la vôtre. Faire cela n’était pas une option viable pour nous, et comme nous l’avons réalisé, la qualité des données dans HAFAS est inégale. Non seulement les gares de régions entières sont absentes dans certains cas, mais l’emplacement de la gare est parfois complètement décalé.

Le registre européen des infrastructures est tenu par l’Agence de l’Union européenne pour les chemins de fer et chaque État-membre (ainsi que la Norvège et la Suisse) est censé déclarer les gares sur son territoire (et autres informations relatives aux chemins de fer) dans la base de données. Le RINF est, à notre connaissance, la liste officielle la plus complète des gares dans toute l’Europe. Nous avons déterminé que le RINF était la meilleure solution pour trouver commodément les données individuelles des États. Avec le recul, nous avons remarqué que la couverture des chemins de fer privés dans le RINF était lacunaire pour certains pays. Vous pouvez en savoir plus sur RINF ici .

Les listes de contributions participatives ne sont pas une mauvaise alternative, mais comme nous avions besoin de vérifier s’il était possible de partir depuis une gare spécifique, nous devions nous appuyer sur le nom et les coordonnées correspondant à une autre source (dans notre cas HAFAS), c’est pourquoi nous avons conclu qu’une source officielle était plus appropriée.

Une autre difficulté avec nos données est que la grille de population que nous utilisons pour le nombre d’habitants en Europe date de 2011. Sans aucun doute, les populations ont augmenté et les pays ont continué à s’urbaniser depuis, mais ce sont les derniers chiffres disponibles.

Notes

  • Les lieux suivants ont été exclus de l’analyse, même s’ils appartiennent ou sont liés à des pays que nous avons analysés. Corse (France), Bornholm (Danemark), Irlande du Nord (Royaume-Uni), île de Wight (Royaume-Uni), Orcades (Royaume-Uni), Shetland (Royaume-Uni), Hébrides extérieures (Royaume-Uni), Åland (Finlande), Açores (Portugal), Madère (Portugal) et Gotland (Suède). Nous avons exclu ces zones car elles ne sont pas reliées au continent où se trouve la destination finale. D’autres îles peuplées ont pu être incluses dans nos résultats, par exemple Lampedusa (Italie) et Heligoland (Allemagne).
  • Toutes les gares du nouveau train léger sur rail Letbanen du Danemark n’étaient pas encore dans les données des gares européennes lorsque nous avons effectué la recherche.

FAQ

Comment le nombre de pas a-t-il été calculé ?

Km / 1.6 * 1975 (source )

Comment avez-vous déterminé si une zone était urbaine, rurale ou intermédiaire ?

Nous avons cartographié tous les carrés de population par régions NUTS3, puis cartographié chaque carré conformément à la typologie NUTS3 correspondante définie par Eurostat ici .

Savons-nous si le Registre européen des infrastructures contient toutes les gares d’Europe ?

Non. En fait, nous savons que beaucoup de gares roumaines et néerlandaises étaient manquantes lorsque nous avons exporté les données. Nous savons également que les données RINF contenaient de nombreuses gares désaffectées. Le rapprochement des données du RINF et HAFAS nous a permis d’exclure autant de résultats erronés que possible. Nous avons ajouté des gares provenant d’autres sources pour les Pays-Bas, l’Allemagne et l’Italie, mais nous ne savons pas à 100% si nous avons réussi à trouver toutes les gares pertinentes, au contraire, il est très probable qu’il en manque.

Une gare du RINF est-elle toujours reliée à la bonne gare HAFAS ?

Non, mais elle est reliée à une gare HAFAS ayant un nom similaire qui se trouve à moins de 500 mètres, ce qui signifie généralement qu’il s’agit de la même gare. Ces disparités existent mais elles sont peu nombreuses et ne devraient pas affecter l’analyse.

Savons-nous si HAFAS dispose des horaires corrects et mises à jour pour toutes les gares ?

Non. Notre hypothèse est que si HAFAS dit que vous pouvez partir en train d’une gare, alors HAFAS est correct. Nous supposons également que si HAFAS dit que vous ne pouvez pas partir en train depuis telle gare, cette réponse peut être fausse. C’est pourquoi nous avons vérifié manuellement et (le cas échéant) reclassé toutes les gares qui ont reçu de telles réponses de HAFAS.

Comment avons-nous mesuré les distances ?

À vol d’oiseau / en ligne droite.

Certaines personnes vivent à la frontière d’un pays voisin de l’UE. Pourquoi ne permettons-nous pas à une gare de l’autre côté de la frontière d’être pertinente?

Les données ne permettent pas une analyse transfrontalière, car nous ne disposons pas de données pour suffisamment de pays.

Les trains et les gares de banlieue sont-ils inclus (par exemple S-bahn, Pendeltåg etc.)?

Nous n’avons pas classé les trains ou les gares par type de trafic (transnational, national, régional ou suburbain). Cela signifie que dans certains cas, les trains de banlieue sont inclus et dans d’autres, non. Comme nous avons simulé des trajets vers n’importe quelle gare de la capitale, nous avons déterminé qu’il est sûr de supposer que les trains de banlieue concerneront principalement les distances dans les régions NUTS3 où se trouve la capitale.

Est-il possible que vous ayez classé une gare comme non pertinente en raison de suspension temporaire de la desserte ?

Oui, mais c’est peu probable. Pour chaque gare initialement classée comme non pertinente, nous avons revérifié le classement en recherchant un trajet vers la capitale sur le site de réservation national avec des dates de départ différentes. Ce faisant, nous avons par exemple remarqué qu’au Danemark il y avait beaucoup de travaux en cours qui faussaient nos données, et nous y avons remédié en reclassant les gares comme pertinentes. Des suspensions de trafic plus longues (1 mois) peuvent cependant avoir des implications que nous ignorons car certains sites de réservation ne nous permettent pas de rechercher un itinéraire au-delà de ce délai.

Traductions disponibles
mercredi 18 décembre 2019

Source/s:

Journalism++
share subcribe newsletter