Don't miss the train: Metodologia

O que fizemos e como o fizemos

Este artigo tenta responder a uma questão aparentemente simples: até que ponto é fácil para os cidadãos europeus viajar de comboio e o que explica as diferenças entre os países? Numa tentativa para responder a isto, decidimos observar duas medidas: as distâncias até às estações de comboios e a proporção de pessoas que têm bom acesso (estão a menos de 10 000 passos de uma estação) em comparação às que têm fraco acesso (estão a pelo menos 30 000 passos de uma estação) à rede ferroviária.

A distância até uma estação de comboios diz-nos o quanto alguém tem de viajar, enquanto as outras medições nos dão uma ideia de quantas pessoas precisam de usar um carro, autocarro ou táxi para chegar a uma estação de comboios. O limite de 30 000 é arbitrário, mas baseia-se no pressuposto de que é provável que não ande tal distância para apanhar um comboio.

Não encontramos qualquer fonte oficial ou não oficial que contenha dados dos países europeus sobre as distâncias até às estações de comboios ou números sobre quantas pessoas vivem perto de uma estação de comboios. Isto significa que tivemos de reunir e criar estes dados.

Eis o que fizemos, passo a passo:

1. Em julho de 2019, descarregamos todas as estações de comboios da European Register of Infrastructure (requer início de sessão ). O número total de estações descarregadas foi 29 511.

A Register of Infrastructure não continha dados relativos à Irlanda e à Suíça. A qualidade dos dados para a Roménia e os Países Baixos era muito fraca. Acabamos por excluir a Roménia, a Irlanda e a Suíça da análise. Para os Países Baixos, recolhemos estações adicionais da Wikipédia. Também adicionámos mais estações de outras fontes para a Itália e a Alemanha.

2. Em outubro de 2019, pesquisamos o nome das estações de comboios no HaCon Fahrplan-Auskunfts-System (HAFAS) e combinamos as duas fontes de dados quando apontavam para a mesma estação de comboios.

Este passo corresponde basicamente à pesquisa de uma estação de comboios através do sistema de reserva da Deutsche-Bahn . Uma vez que queríamos pesquisar milhares de estações, utilizamos o que se liga às API de transportes públicos do HAFAS.

Basicamente, pesquisamos o nome de uma estação do RINF e o HAFAS devolvia todos os nomes de estações similares na base de dados e selecionamos a que ficava mais próximo da estação RINF. Nem sempre foi óbvio.

Para cada estação no RINF que o HAFAS não reconheceu, tivemos de verificar manualmente se existiam estações de comboios. Algumas existiam, outras não. Apenas avançamos com os países em que era possível mapear ou explicar, pelo menos, 90% das estações disponíveis no RINF. Os países seguintes foram removidos deste passo: Estónia, Letónia, Lituânia, Grécia, Espanha, Noruega e Eslováquia. Isto significa que os dados do HAFAS para estes países eram especialmente fracos no momento.

3. Apenas incluímos países onde o HAFAS tinha cobertura total dos horários dos comboios.

Estimamos a cobertura ao simular cinco rotas de comboio conhecidas por países, verificando se o HAFAS sabia que era possível fazê-las de comboio. (As rotas podem ser vistas aqui ) Apenas avançávamos com a análise para o país se a base de dados identificasse com sucesso que todas as 5 rotas eram possíveis de efetuar por comboio.

Dos 16 países resultantes do último passo, verificámos que a API identificou corretamente todas as rotas disponíveis por comboio.

4. Categorizamos as estações de comboios como relevantes ou não relevantes. O número total de estações de comboios relevantes foi de 22 852.

Para nós, uma estação de comboios relevante é uma estação de comboios a partir da qual é possível viajar de comboio (são permitidas mudanças de comboios) até à capital. Uma estação de comboios não relevante é uma estação de comboios a partir da qual é necessário conduzir ou apanhar o autocarro (ainda que apenas parte da rota) para chegar à capital.

Categorizamos cada estação como relevante ou não relevante, consoante a resposta do HAFAS ao simular 25 viagens a partir de cada estação para a estação de comboios da capital. Verificamos duas vezes e, sempre que necessário, recategorizámos manualmente todas as estações que, segundo os dados do HAFAS, não eram relevantes.

Categorizamos estações na Sicília e na Sardinha como relevantes, pois alguns parceiros sugeriram que o comboio era uma opção viável para viajar até à capital a partir destas ilhas, ainda que também seja necessário apanhar um ferry. Adicionamos manualmente mais estações para Itália (+116), os Países Baixos (+11) e a Alemanha (+320) que estavam em falta no RINF ou no HAFAS. 

5. Para cada país, identificámos a estação de comboios relevante mais próxima para cada pessoa no país.

Definimos linhas retas entre todos quilómetros quadrados numa grelha de população de 1x1 km e todas as estações de comboios relevantes de um determinado país e considerámos a linha mais próxima da estação de comboios.

Problemas gerais com a qualidade dos nossos dados

Não encontrámos qualquer fonte aberta internacional ou regional, privada ou pública, que contenha uma lista abrangente das estações de comboios existentes na Europa. Se tiver interesse nesta questão das estações de comboios têm, na nossa opinião, quatro alternativas: o sistema HAFAS (HaCon Fahrplan-Auskunfts-System), o RINF (European Register of Infrastructure), as autoridades nacionais ou quaisquer listas colaborativas que podem ser encontradas online.

O HAFAS é um sistema de reserva desenvolvido para subsidiária privada da Siemens, a Hannover Consulting. A vantagem do HAFAS é que bastantes grandes transportadoras nos países europeus que o usam para a reserva nos seus websites. A desvantagem é que é privado e a empresa não publica a sua lista de estações, é necessário criar uma. Isto não era uma opção viável para nós e como viemos a perceber, a qualidade dos dados no HAFAS por vezes era fraca. Não só o sistema não inclui estações para regiões inteiras em alguns países, como a localização da estação nem sempre está correta.

O European Register of Infrastructure é mantido pela European Railway Agency e cada Estado-Membro (incluindo a Noruega e a Suíça) deve comunicar as suas estações (e outras informações relacionadas com os caminhos de ferro) para serem incluídas na base de dados. O RINF é, daquilo que percebemos, a lista oficial mais abrangente de estações na Europa. Determinámos que o RINF era melhor ferramenta para abordar individualmente todos os Estados. Por conseguinte, reparámos que a cobertura de linhas ferroviárias privadas tinha menos probabilidade de ser incluídas no RINF para alguns países. Pode ler mais sobre o RINF aqui .

As listas colaborativas não são uma má ideia, mas como queríamos verificar se era possível viajar a partir de uma estação de comboios específica, confiámos no nome e coordenadas correspondentes a outra fonte (no nosso caso o HAFAS), por isso, determinamos que uma fonte oficial era mais adequada.

Outro problema relacionado com os nossos dados é que a grelha de população que usamos para representar as pessoas na Europa é de 2011. Não há dúvida de que a população aumentou e os países tornaram-se mais urbanos desde então, mas é a grelha mais recente disponível.

Notas

  • Os locais seguintes foram excluídos da análise, embora pertençam ou estejam ligados aos países que analisamos. Córsega (França), Bornholm (Dinamarca), Norte da Irlanda (Reino Unido), Ilha de Wight (Reino Unido), Orkney (Reino Unido), Shetland (Reino Unido), Hébridas Exteriores (Reino Unido), Åland (Finlândia), Açores (Portugal), Madeira (Portugal) e Gotland (Suécia). Excluímos estas áreas pois não estão ligadas ao território principal, onde se situa o destino. Existem outras ilhas habitadas que se encontram incluídas nos nossos resultados como, por exemplo, Lampedusa (Itália) e Heligoland (Alemanha).
  • Todas as estações na nova linha de metro Letbanen da Dinamarca ainda não estavam nos dados das estações europeias quando realizamos a investigação.

Perguntas frequentes

Como calculámos os passos?

Km / 1,6 * 1975 (fonte )

Como determinámos se uma área é urbana, rural ou intermédia?

Mapeámos os quilómetros quadrados segundo a Nomenclatura das Unidades Territoriais para Fins Estatísticos 3 (NUTS3) e, em seguida, correspondemos cada quilómetro quadrado à tipologia NUTS3, conforme definido pelo Eurostat aqui .

O European Register of Infrasctruture contém todas as estações da Europa?

Não. Na verdade, verificámos que o registo não continha muitas das estações da Roménia e dos Países Baixos quando exportámos os dados. Também sabemos que os dados do RINF continham muitas estações fora de serviço. A conjugação dos dados do RINF e do HAFAS permitiu-nos excluir ao máximo os falsos positivos. Adicionámos mais estações de outras fontes para os Países Baixos, a Alemanha e a Itália. No entanto, não temos a certeza se conseguimos encontrar todas as estações relevantes e é muito provável que tenhamos deixado algumas de fora.

Uma estação RINF corresponde sempre à estação HAFAS correta?

Não, corresponde a uma estação HAFAS com um nome diferente que fica a 500 metros da mesma, o que normalmente significa que se trata da mesma estação. Este tipo de disparidades existe, mas não são muitas e não deverão afetar a análise.

O HAFAS tem os horários corretos e atualizados de todas as estações?

Não. Baseámo-nos no pressuposto de que se o HAFAS afirma que podemos efetuar a viagem de uma estação por comboio, este está correto. Também assumimos que se o HAFAS afirma que não é possível efetuar a viagem de comboio, essa afirmação poderá ser falsa. É por este motivo que verificámos manualmente, sempre que necessário, e recategorizámos todas as estações para as quais o HAFAS devolvia tal resposta.

Como calculámos a distância?

Através de linhas retas/curtas.

Algumas pessoas vivem na fronteira de um país europeu vizinho. Porque não se considera uma estação de comboios do outro lado da fronteira relevante?

Os dados não permitem uma análise transfronteiriça, uma vez que não temos dados de todos os países.

As estações e os comboios suburbanos estão incluídos (por exemplo, S-bahn, Pendeltåg, etc.)?

Não categorizámos comboios ou estações por tipo de tráfego (transnacional, nacional, regional ou suburbano). Isto significa que em alguns casos, os comboios suburbanos são incluídos e noutros não. Uma vez que simulámos itinerários para qualquer estação na capital, determinámos que os comboios suburbanos irão sobretudo afetar distâncias nas regiões NUTS3, onde se encontra a capital.

É possível que tenham categorizado uma estação de comboios como não relevante devido a suspensões temporárias no tráfego?

Sim, mas dificilmente. Cada estação inicialmente categorizada como não relevante foi verificada novamente através de uma pesquisa por uma viagem até à capital no website de reservas nacional com diferentes datas de partida. Ao fazê-lo, reparamos, por exemplo, que a Dinamarca tinha muitas linhas ferroviárias em curso que estavam a distorcer os nossos dados, os quais corrigimos ao recategorizar as estações como relevantes. As suspensões de tráfego mais longas (superiores a 1 mês) podem no entanto ter implicações desconhecidas, uma vez que alguns websites de reserva não permitem pesquisas tão adiantadas.

Quarta-Feira, 18 de Dezembro de 2019

Fonte/s:

Journalism++
share subcribe newsletter