Αυτό το άρθρο προσπαθεί να απαντήσει σε μία φαινομενικά ευθύς ερώτηση: πόσο εύκολο είναι για τους Ευρωπαίους να ταξιδέψουν με τρένο, και πως εξηγούνται οι διαφορές μεταξύ των χωρών; Στην προσπάθεια μας να απαντήσουμε σε αυτό το ερώτημα, εξετάσαμε δύο παράγοντες- τις αποστάσεις για να φτάσει κανείς στους σιδηροδρομικούς σταθμούς και το ποσοστό των ατόμων που είναι καλά συνδεδεμένοι (λιγότερο από 10.000 βήματα για να φτάσεις σε ένα σταθμό) έναντι εκείνων που είναι κάκιστα συνδεδεμένοι (τουλάχιστον 30.000 βήματα για να φτάσεις σε ένα σταθμό) με το σιδηροδρομικό δίκτυο.
Η απόσταση για να φτάσεις σε ένα σιδηροδρομικό σταθμό μας λέει πόσο μακριά χρειάζεται να μετακινηθεί κανείς ενώ ο άλλος παράγοντας μας δίνει μία αίσθηση του ποσοστού των ανθρώπων που βασίζονται στα αυτοκίνητα, λεωφορεία ή στα ταξί προκειμένου να φτάσουν στο σταθμό του τρένου. Το σημείο αναφοράς των 30.000 βημάτων είναι αυθαίρετο, αλλά βασίζεται στην υπόθεση ότι δεν είναι πιθανό να περπατήσει κανείς τόσο μεγάλη απόσταση μόνο και μόνο για να φτάσει σε ένα τρένο.
Δεν βρήκαμε καμία επίσημη ή ανεπίσημη πηγή που να περιέχει δεδομένα για τις ευρωπαϊκές χώρες και τις αποστάσεις που έχουν οι σιδηροδρομικοί σταθμοί ή δεδομένα σχετικά με το πόσοι άνθρωποι ζουν κοντά σε σιδηροδρομικό σταθμό. Αυτό σήμαινε ότι έπρεπε να συγκεντρώσουμε και να δημιουργήσουμε αυτά τα δεδομένα εμείς.
Τι κάναμε βήμα βημά:
1. Τον Ιούλιο του 2019, «κατεβάσαμε» όλους τους σιδηροδρομικούς σταθμούς από το Ευρωπαϊκό Μητρώο Υποδομών (RINF, απαιτείται σύνδεση: https://rinf.era.europa.eu/rinf). Ο συνολικός αριθμός των σταθμών που λήφθηκαν ήταν 29.511.
Το μητρώο υποδομής δεν περιείχε στοιχεία για την Ιρλανδία και την Ελβετία. Η ποιότητα των δεδομένων για τη Ρουμανία και τις Κάτω Χώρες ήταν πολύ φτωχή. Καταλήξαμε έτσι στο συμπέρασμα ότι έπρεπε να εξαιρέσουμε από την ανάλυση μας την Ρουμανία, την Ιρλανδία και την Ελβετία. Για τις Κάτω Χώρες συγκεντρώσαμε επιπλέον σταθμούς από τη Wikipedia. Προσθέσαμε επίσης περισσότερους σταθμούς από άλλες πηγές και για την Ιταλία και τη Γερμανία.
2. Τον Οκτώβριο του 2019, αναζητήσαμε το όνομα των σιδηροδρομικών σταθμών στο HaCon Fahrplan-Auskunfts-System (HAFAS) και συνδυάσαμε τις δύο πηγές δεδομένων όταν έδειχναν τον ίδιο σιδηροδρομικό σταθμό.
Αυτό το βήμα είναι περίπου το ίδιο με το ψάχνεις για ένα σιδηροδρομικό σταθμό χρησιμοποιώντας το σύστημα κρατήσεων της Deutsche-Bahn . Από τη στιγμή που θέλαμε να ψάξουμε χιλιάδες σταθμούς χρησιμοποιήσαμε το https://github.com/public-transport/hafas-client που συνδέεται με τα API (Διασύνδεση Προγραμματισμού Εφαρμογών) των δημοσίων μεταφορών HAFAS.
Για να το θέσουμε απλά, αναζητήσαμε ένα όνομα σταθμού στο RINF, το HAFAS παρουσίασε όλα τα παρόμοια ονόματα σταθμών στη βάση δεδομένων του και από αυτά επιλέξαμε αυτό που βρίσκεται πλησιέστερα στον σταθμό RINF. Αυτό δεν ήταν πάντα προφανές.
Για κάθε σταθμό στο RINF που το HAFAS δεν γνώριζε, ελέγχαμε εμείς αν ήταν σταθμοί τρένων. Μερικοί ήταν, αλλά μερικοί δεν ήταν. Προχωρήσαμε μόνο με χώρες όπου μπορούμε να αντιστοιχήσουμε ή να εντοπίσουμε τουλάχιστον το 90% των σταθμών στο RINF. Οι ακόλουθες χώρες αποσύρθηκαν από την έρευνα σε αυτό το στάδιο: Εσθονία, Λετονία, Λιθουανία, Ελλάδα, Ισπανία, Νορβηγία και Σλοβακία. Αυτό σημαίνει ότι τα στοιχεία του HAFAS για τις χώρες αυτές ήταν ιδιαίτερα φτωχά εκείνη τη στιγμή.
3. Συμπεριλάβαμε μόνο χώρες όπου η HAFAS είχε πλήρη κάλυψη στα χρονοδιαγράμματα των αμαξοστοιχιών.
Ερευνήσαμε την κάλυψη με τη προσομοίωση πέντε γνωστών δρομολογίων τρένων ανά χώρα, ελέγχοντας εάν η HAFAS ήξερε ότι θα μπορούσε κανείς να ταξιδέψει αυτές τις διαδρομές με τρένο (οι διαδρομές μπορούν να βρεθούν εδώ ). Μόνο εάν η βάση δεδομένων αναγνώριζε με επιτυχία και τις 5 διαδρομές σε μια δεδομένη χώρα ως «ταξιδιώσιμη» με τρένο, προχωρήσαμε στην ανάλυση για τη συγκεκριμένη χώρα .
Από τις 16 χώρες που αφήσαμε το προηγούμενο βήμα, διαπιστώσαμε ότι το API έχει εντοπίσει σωστά όλες τις διαδρομές που είναι διαθέσιμες με το τρένο.
4. Κατηγοριοποιήσαμε τους σιδηροδρομικούς σταθμούς ως χρήσιμους και μη χρήσιμους. Ο συνολικός αριθμός χρήσιμων σιδηροδρομικών σταθμών ήταν 22.852.
Σύμφωνα με εμάς, χρήσιμος σταθμός είναι εκείνος που μπορείς να ταξιδέψεις με τρένο ( ενδιάμεσες εναλλαγές με άλλα τρένα επιτρέπονται) έως την πρωτεύουσα. Ένας μη χρήσιμος σταθμός είναι εκείνος που θα πρέπει να οδηγήσεις ή να πάρεις λεωφορείο (ακόμα και για ένα τμήμα της διαδρομής) για να φτάσεις στην πρωτεύουσα.
Κατηγοριοποιήσαμε κάθε σταθμό ως χρήσιμο ή μη χρήσιμο με βάση τα αποτελέσματα που προέκυψαν από τη HAFAS όταν προσομοιώσαμε 25 ταξίδια για κάθε σταθμό της πρωτεύουσας κάθε χώρας. Το διπλό-ελέγξαμε, όταν χρειαζόταν, μη-αυτόματα και (επανα-)κατηγοριοποιήσαμε όλους τους σταθμούς που δεν ήταν χρήσιμοι σύμφωνα με τα δεδομένα της HAFAS.
Κατηγοριοποιήσαμε τους σταθμούς στη Σικελία και τη Σαρδηνία ως σημαντικοί (χρήσιμοι), επειδή οι συνεργάτες μας πρότειναν ότι το τρένο ήταν μια βιώσιμη επιλογή να ταξιδέψει κανείς στην πρωτεύουσα από αυτά τα νησιά, ακόμα κι αν πρέπει να πάρει και πλοίο. Προστέθηκαν με μη αυτόματο τρόπο περισσότεροι σταθμοί για την Ιταλία (+116), την Ολλανδία (+11) και τη Γερμανία (+320) καθώς έλειπαν από το RINF ή το HAFAS.
5. Για κάθε χώρα, βρήκαμε τον κοντινότερο χρήσιμο σταθμό τρένων για κάθε κάτοικο στη χώρα
Σχεδιάσαμε γραμμές μεταξύ όλων των τετραγώνων σε ένα δίκτυο πληθυσμού 1x1 km και όλους τους χρήσιμους σιδηροδρομικούς σταθμούς σε μια δεδομένη χώρα και ταξινομήσαμε την πιο σύντομη γραμμή ως το κοντινότερο σιδηροδρομικό σταθμό.
Δεν εντοπίσαμε καμία ανοικτή διεθνή ή περιφερειακή πηγή, ιδιωτική ή άλλη, η οποία να περιλαμβάνει μία εξαντλητική λίστα των σιδηροδρομικών σταθμών σε ολόκληρη την Ευρώπη. Εάν ενδιαφέρεστε για το θέμα των σιδηροδρομικών σταθμών, έχετε, όπως βλέπουμε, τέσσερις εναλλακτικές λύσεις: HAFAS (HaCon Fahrplan-Auskunfts-System), RINF (Ευρωπαϊκό Μητρώο Υποδομών), τις εθνικές αρχές ή οποιουσδήποτε από τους ανοιχτούς καταλόγους που μπορούν να βρεθούν στο διαδίκτυο.
Το HAFAS είναι ένα σύστημα κρατήσεων που αναπτύχθηκε από την ιδιωτική θυγατρική της Siemens Hannover Consulting. Το προτέρημα του HAFAS είναι ότι αρκετά μεγάλες εταιρίες μεταφορών σε χώρες της Ευρώπης το χρησιμοποιούν στις ιστοσελίδες κρατήσεων τους. Το μειονέκτημα του είναι ότι είναι ιδιόκτητο και η εταιρεία δεν δημοσιεύει τη λίστα των σταθμών του - πρέπει να δημιουργήσετε τη δική σας. Αυτό δεν ήταν βιώσιμη επιλογή για εμάς, και όπως συνειδητοποιήσαμε - η ποιότητα των δεδομένων στην HAFAS είναι μερικές φορές κακή. Το σύστημα δεν διαθέτει σταθμούς για ολόκληρες περιοχές σε ορισμένες χώρες και συχνά η γεωγραφική θέση του σιδηροδρομικού σταθμού στο σύστημα είναι εντελώς λάθος.
Το Ευρωπαϊκό Μητρώο Υποδομών διατηρείται από τον Ευρωπαϊκό Οργανισμό Σιδηροδρόμων και κάθε κράτος μέλος (καθώς και η Νορβηγία και η Ελβετία) υποτίθεται ότι σημειώνουν τους σταθμούς (και άλλες πληροφορίες σχετικά με τους σιδηροδρόμους) στη βάση δεδομένων. Το RINF είναι, από όσο έχουμε διαπιστώσει, ο πιο λεπτομερής επίσημος κατάλογος σταθμών σε όλη την Ευρώπη. Διαπιστώσαμε ότι το RINF είναι η καλύτερη επιλογή, διότι μπορούμε να αναλύσουμε όλα τα κράτη μεμονωμένα. Εκ των υστέρων όμως, παρατηρήσαμε ότι η κάλυψη των ιδιωτικών σιδηροδρόμων ήταν λιγότερο πιθανό να συμπεριληφθεί στο RINF για ορισμένες χώρες. Μπορείτε να διαβάσετε περισσότερα για το RINF εδώ .
Οι λίστες Crowdsourced δεν είναι κακή εναλλακτική λύση, αλλά επειδή θέλαμε να ελέγξουμε αν μπορείς να ταξιδέψεις από συγκεκριμένο σταθμό, βασιζόμασταν στο ότι το όνομα και οι συντεταγμένες του σταθμού θα συμβάδιζαν με μία ακόμα πηγή (στην περίπτωση μας το HAFAS) και γι 'αυτό αποφασίσαμε ότι μια επίσημη πηγή ήταν καταλληλότερη.
Ένα άλλο πρόβλημα με τα δεδομένα μας είναι ότι το δίκτυο πληθυσμού που χρησιμοποιούμε για να αντιπροσωπεύσουμε τους ανθρώπους στην Ευρώπη είναι από το 2011. Αναμφισβήτητα, οι πληθυσμοί έχουν αυξηθεί εκ τότε και οι χώρες έχουν γίνει πιο αστικοποιημένες, αλλά είναι το τελευταίο διαθέσιμο δίκτυο πληθυσμού που υπάρχει.
Πώς υπολογίσατε τα βήματα;
Km / 1.6 * 1975 (πηγή )
Πώς καθορίζεται εάν μια περιοχή είναι αστική, αγροτική ή ενδιάμεση;
Έχουμε χαρτογραφήσει όλες τα κουτάκια πληθυσμού στις περιοχές NUTS3 και στη συνέχεια αντιστοιχήσαμε κάθε τετράγωνο στην αντίστοιχη τυπολογία NUTS3 όπως ορίζεται από την Eurostat εδώ .
Γνωρίζουμε ότι το Ευρωπαϊκό Μητρώο Υποδομών περιέχει όλους τους σταθμούς σε ολόκληρη την Ευρώπη;
Όχι. Στην πραγματικότητα γνωρίζαμε όταν εξάγαμε τα δεδομένα ότι από το Μητρώο έλειπαν αρκετοί σταθμοί από τη Ρουμανία και την Ολλανδία. Επίσης γνωρίζαμε ότι το RINF περιείχε δεδομένα από σταθμούς που δεν είναι πλέον σε λειτουργία. Η αντιστοίχιση των δεδομένων του RINF σε αυτά του HAFAS μας επέτρεψαν να εντοπίσουμε τα λάθη. Αλλά δεν είμαστε σίγουροι ότι κατορθώσαμε να βρούμε όλους τους χρήσιμους σταθμούς, αντίθετα πιστεύουμε ότι είναι πολύ πιθανό να έχουμε παραλείψει κάποιους.
Προστέθηκαν περισσότεροι σταθμοί από άλλες πηγές για την Ολλανδία, τη Γερμανία και την Ιταλία.
Ένας σταθμός RINF αντιστοιχεί πάντα στο σωστό σταθμό HAFAS;
Όχι, αλλά βρίσκεται σε αντιστοιχία με σταθμό του HAFAS με παρόμοιο όνομα που βρίσκεται σε απόσταση 500 μέτρων από αυτό, πράγμα που σημαίνει συνήθως ότι είναι ο ίδιος σταθμός. Αυτά τα είδη αναντιστοιχιών υπάρχουν αλλά είναι λίγα και δεν αναμένεται να επηρεάσουν την ανάλυση.
Γνωρίζουμε ότι το HAFAS έχει σωστά και ενημερωμένα χρονοδιαγράμματα για όλους τους σταθμούς;
Όχι. Η υπόθεση μας είναι ότι αν ο HAFAS λέει ότι μπορείς να ταξιδέψεις από ένα σταθμό με τρένο, τότε το HAFAS είναι σωστό. Υποθέτουμε επίσης ότι εάν η HAFAS λέει ότι δεν μπορείς να ταξιδέψεις από ένα σταθμό με τρένο - αυτή η απάντηση μπορεί να είναι και ψευδής. Αυτός είναι ο λόγος για τον οποίο ελέγχαμε και με μη-αυτόματο τρόπο τα δεδομένα και (όταν ήταν απαραίτητο) ανακατατάζαμε όλους τους σταθμούς που είχαν απαντήσεις από το HAFAS.
Πώς μετράμε τη απόσταση;
Σε ευθείες γραμμές
Μερικοί άνθρωποι ζουν στα σύνορα με μια γειτονική χώρα της ΕΕ. Γιατί δεν επιτρέπουμε την ύπαρξη χρήσιμων σιδηροδρομικών σταθμών πέρα από τα σύνορα;
Τα δεδομένα δεν επιτρέπουν μια διασυνοριακή ανάλυση, δεδομένου ότι δεν διαθέτουμε δεδομένα για αρκετές χώρες.
Περιλαμβάνονται προαστιακές αμαξοστοιχίες και σταθμοί (όπως S-bahn, Pendeltåg κ.α.);
Δεν έχουμε κατηγοριοποιήσει τα τρένα ή τους σταθμούς ανά τύπο κυκλοφορίας (διακρατικό, εθνικό, περιφερειακό ή προαστιακό). Αυτό σημαίνει ότι σε ορισμένες περιπτώσεις περιλαμβάνονται προαστιακές αμαξοστοιχίες και σε ορισμένες περιπτώσεις δεν περιλαμβάνονται. Δεδομένου ότι έχουμε προσομοιώσει ταξίδια σε οποιοδήποτε σταθμό στην πρωτεύουσα κάθε χώρα, καταλήξαμε ότι είναι ασφαλές να υποθέσουμε ότι τα προαστιακά τρένα θα επηρεάσουν τις αποστάσεις στις περιφέρειες NUTS3 όπου είναι και η πρωτεύουσα.
Είναι πιθανό να ταξινομήσατε ένα σιδηροδρομικό σταθμό ως μη χρήσιμο λόγω προσωρινών αναστολών της κυκλοφορίας;
Ναι, αλλά είναι απίθανο. Για κάθε σταθμό που αρχικά χαρακτηρίστηκε ως μη χρήσιμος, ελέγξαμε εκ των υστέρων την ταξινόμηση αναζητώντας μία διαδρομή έως την πρωτεύουσα στην εθνική ιστοσελίδα κρατήσεων με διαφορετικές ημερομηνίες αναχώρησης. Με αυτόν τον τρόπο, παρατηρήσαμε, για παράδειγμα, ότι η Δανία είχε πολλά σιδηροδρομικά έργα που επηρέαζαν τα δεδομένα μας, τα οποία διορθώσαμε στη συνέχεια ανακατατάσσοντας τους σταθμούς αναλόγως. Ωστόσο, για μεγαλύτερες αναστολές κυκλοφορίας (+1 μήνα) ενδέχεται να υπάρχουν επιπτώσεις που δεν γνωρίζουμε, καθώς ορισμένοι ιστότοποι κρατήσεων δεν επιτρέπουν να αναζητήσεις διαδρομών για πιο μετά από αυτό το χρονικό όριο ( του ενός μήνα).