lundi 11 juin 2012

Ponctualité des TGV en Avril 2012 - Tableau de bord Google Spreadsheet

0 commentaires
La SNCF se met aussi à l'Open Data et propose plusieurs set de données dont un qui concerne la ponctualité des TGV.
On peut récupérer sur le site open data de la SNCF le nombre de retard par ligne sur un mois. Afin d'avoir une représentation de ces données et montrer les possibilités de Google Spreadsheet voici un tableau de bord avec une représentation des données fournies.
 
Dans ce fichier est listé :
  • Les pires et meilleurs trains
  • Les plus mauvaises lignes
  • Les retards par gares principales (gares parisiennes généralement)
  • Les retard par trajet Aller ou Retour
  • Les plus mauvaises gare de départ ou d'arrivée

Vous pouvez consulter le dashboard sur cette page : Ponctualité TGV Avril 2012
On ne peut pas savoir le type et la durée du retard dans les données proposées par la SNCF donc il faut pondérer l'analyse car un retard de 6 minutes sera équivalent à un retard de 2 heures dans ce tableau.

Comment c'est fait
Pour créer ces tableaux j'ai juste mis en forme les données fournit par la SNCF afin de lister les gares principales, les lignes et les trajet Aller/Retour.
Tous les tableaux sont fait avec des Query. J'utilise des fonctions 'Group By', 'Sum', 'Order by', 'Limit' et 'Label'. Si vous souhaitez voir comment sont construites ces requêtes pour la fonction query vous pouvez vous créer une copie du fichier. Fichier Ponctualité TGV Avril 2012.

Leave a Reply