L’open data à l’épreuve de la pénurie d’essence

Global comparatif

Face à la pénurie de carburant sur plusieurs départements de France, un constat : la difficulté à trouver des informations fiables concernant les stations-service sur le territoire et leur disponibilité en carburant.

Comparatif

Les informations existantes ne suffisent pas

Les GPS proposent à leurs usagers des stations-service proches, et des cartographies de stations ont déjà été publiées. Or, ces informations se basent essentiellement sur des bases de données incomplètes.

Les 3 principaux référents en ligne sur l’état de la pénurie sont actuellement

Ces derniers répertorient 10 245 stations pour la France (chiffre fluctuant). Selon Le Monde, l’UFIP en dénombre 11 269, quand la base ouverte de référence en comptabilise 12 097 et il en manque encore. Pour ce qui est de l’état des stocks de carburant aux stations, le site prix-carburants.gouv.fr ne publie cette information qu’avec 7 jours de carence. Aucune initiative ne redistribue librement les contributions des conducteurs. Cette approche logiquement concurrentielle ne permet pas les enrichissements de l’information qui permettraient d’avoir une vision globale de la situation.

Les voitures ne circulent pas, l’information non plus.

L’association Libertic, qui fait la promotion du libre accès à l’information publique en open data a donc cherché à libérer les données aujourd’hui accessibles sur les stations-service. L’objectif étant de permettre à chacun de s’en emparer, de créer des cartes plus exhaustives et d’en favoriser la diffusion. Ces données permettront également de réaliser des sites collaboratifs qui remettraient librement à disposition les contributions sur la pénurie.

Voici les étapes, contrariétés, et découvertes de ce projet #Hackpenurie en cours.

 

Etape 1. Trouver des données

Nous avons d’abord listé les sources potentielles de données géolocalisant les stations afin de pouvoir les compiler. Jusque récemment, la publication d’une base de données d’entreprises sur un territoire était susceptible d’enfreindre le cadre du secret commercial, notamment au pretexte qu’une cartographie des acteurs permettrait de définir la stratégie de leur implantation (faites-vous plaisir). Or, depuis la loi Macron de 2015, un paradoxe se met en place: le secret des affaires (interprétation libre) en même temps que l’open data et la publication du registre Infogreffe, comportant le nom des entreprises et leurs adresses ont vocation à être librement disponibles. Voici quelques sources que nous avons répertoriées, n’hésitez pas à nous en indiquer d’autres !

Prix-carburants.gouv.fr

Cette base nationale collecte les informations et tarifs affichés aux stations-service. 12 097  stations sont répertoriées.

Problèmes

  • Erreurs dans la base: La base n’est pas propre. Des stations-apparaissent en Autriche, Somalie ou dans l’océan. Les longitudes et latitudes sont parfois inversées. Certaines donnéent semblent des doublons.

SomalieLa localisation de stations-service en France, selon la source officielle prix-carburants.gouv.fr qui commercialise la base par ailleurs…

  • Manque d’informations: Des informations ont été tronquées dans la version libre des données : il n’y a pas le nom de la station ni la marque, pénalisant le recoupement. Des incertitudes également sur le numéro identifiant des pompes.
  • Données à -7 jours: Le site ne publie librement que la base de la semaine passée. Or, si nous avions eu les prix du jour-même, nous aurions en même temps l’information sur les pompes n’ayant plus de carburant. L’accès à cette information coûte près de 40 000€. Tant pis pour la disponibilité aux pompes.
  • La base n’est pas exhaustive: Seules les stations avec un débit supérieur à 500m3 annuel sont répertoriées. Ce qui explique que les petites stations-services sont absentes de la base.

20160525_092036(1)Station orpheline. La petite station de Maisdon-sur-Sèvre n’est référencée nulle part (en même temps, elle est en pénurie de carburant…)

Infogreffe

Infogreffe dispose d’un site open data listant les entreprises immatriculées par année. Idéal pour améliorer la base source ? Fausse bonne idée.

Problèmes

  • Manque d’archives: Seules les entreprises immatriculées depuis 2013 sont répertoriées.

  • Catégorisation limitante: Impossible pour nous de retrouver les stations-services dans la catégorisation.

Nous avons abandonné cette source. En espérant que la publication du registre prévue en 2017 puisse prochainement combler ces lacunes.

Openstreetmap

OSM est une base de données cartographique contributive offrant des données totalement libres. Près de 10 000 stations-services ont déjà été répertoriées par les contributeurs. Grâce à Christian, les bénévoles en ligne et nos volontaires, nous nous sommes appuyés sur Openstreetmap.

tagfuel

Problèmes

  • Manque de données: Si la couverture au national reste impressionnante pour un travail de contribution, sur les 243 stations annoncées par la préfecture en Loire-Atlantique, 166 sont répertoriées.

  • Pas d’identifiants: Les données renseignées fournissent parfois le nom de la station, ou les numéros de téléphone mais pas d’identifiant unique permettant de recouper avec Prix-carburants. Il faudra se baser sur les coordonnées.

 

Stations GPL

Source découverte via Openstreetmap, le site http://stations.gpl.online.fr propose une base de données téléchargeable sur les stations distribuant du GPL. Ce sont des coordonnées GPS à convertir.

Problèmes

  • Qualité et Mise à jour: Le site ne semble plus à jour depuis 2011 et des erreurs sont constatées. Nous abandonnons cette source; qui a tout de même servi à quelques recoupements.

BP Suisse

Nous avons commencé à chercher des données sur les sites officiels des distributeurs. Surprise, BP en Suisse propose une base de données « librement accessible ». Cette source est très riche et répertorie à elle seule près de 12 000 stations en France en comptant toutes ses marques. D’autres sites de distributeurs restent à explorer à ce jour.

Problème

  • Licence

La licence d’utilisation associée au service permettant de télécharger les données indique qu’elles sont « librement accessibles ». Est-ce qu’en suisse cela veut dire « réutilisable » ? Il sera toujours possible d’utiliser cette source pour recouper des informations.

Etape 2. Créer des données

Nous avons ensuite cherché quelques informations existantes qui pouvaient être converties en bases de données ouvertes. Ce qui donne :

  • Liste des carburants (source : prix-carburants.gouv.fr)
  • Liste des arrếtés préfectoraux liés à la pénurie (source : Ouest-France, préfectures)
  • Liste des distributeurs de carburant (source : Wikipedia)
  • Compilation des bases (source : prix-carburants/OSM/BP Suisse)
  • Création des correctifs des données africo-norvegiennes

Etape 3. Corriger, compiler et visualiser

La base de prix-carburants a été corrigée via BANO (base publiée ici) . Un exemple d’erreur ci-bas, avec le correctif en rouge intitulé « source gouv bano ».

visuel correctif

Et voici la carte listant et comparant différentes sources de données (OSM/BP/Prix-carburants/Correctif Bano). Cliquer dessus pour naviguer au national.

Global comparatif

La carte de Nantes Métropole

Nous compilons ensuite les données collectées pour faire un test petite échelle, sur la métropole de Nantes.

Carte NM

Nous réalisons parallèlement le 23 mai une campagne de phoning pour vérifier la qualité des données et disponibilité des stations. Des adresses sont corrigées ou supprimées (base locale corrigée à publier prochainement).

Sur 27 stations (sic) affichées sur le listing pages jaunes indiquant les numéros de téléphone, 2/27 n’étaient pas des stations-services. 21 sur les 25 restantes (84%) ont répondu à nos appels. 18/21 sont en pénurie, 1/21 a encore du GPL, 2/21 ont encore deux carburants.

Réaliser ce travail de recoupement à l’échelle du département nous permettrait de vérifier si les chiffres de la préfecture prennent ou non en compte les quelques 3 000 stations-services indépendantes (source FF3C) qui ont probablement un faible débit et ne sont pas répertoriées sur prix-carburants.gouv.fr. A partir de là, est-ce qu’en comptant les stations au débit inférieur à 500m3 annuel le taux de pénurie serait plus élevé que celui annoncé ?

Etape 4: Publication et enrichissement

Nous avons publié librement tous les jeux de données sur data.gouv.fr Chacun peut s’en emparer, les enrichir, et réaliser ses compilations sur son territoire ou au national. La correction du fichier prix-carburants.gouv.fr est également reversée.

Les axes d’améliorations identifiés

En d’autres termes : ce qui nous aurait facilité la tâche.

  • Publier les données quotidiennes exhaustives et corrigées de prix-carburants.gouv.fr
  • Que chaque distributeur publie la liste de ses stations
  • Avoir des identifiants uniques de stations accessibles dans les données
  • Avoir accès à l’enregistrement des stations-services sur Infogreffe avec un historique large
  • Envisager des campagnes cartographiques OSM sur ces données d’intérêt général pour améliorer la base ?
  • Bonus : Pouvoir réutiliser librement les logos des distributeurs pour l’interface usager des plateformes de contribution

Nous étrennons une nouvelle rubrique: Réponse au courrier de lecteurs

Cette semaine nous avons demandé des données ouvertes à la préfecture de Loire-Atlantique, qui n’a pas répondu à ce jour. Suite à cet appel en ligne, un journaliste nous a interpellé très aimablement précisant qu’il ne voyait pas l’intérêt de notre démarche – de recoupement d’informations et qualification des données – (ça laisse songeur).

Alors clairement à quoi sert cette initiative ?

  • À pointer que les efforts d’ouverture de données en France sont aujourd’hui trop faibles
  • À contribuer à l’amélioration de la qualité des données fournies
  • À fournir des données – aux medias notamment – pour qu’ils puissent travailler sur d’autres bases que des copiés-collés de communiqués de préfectures.
  • À favoriser les initiatives de réutilisation de ces données
  • À démontrer l’intérêt des données ouvertes comme levier de meilleure diffusion de l’information

 

 

10 thoughts on “L’open data à l’épreuve de la pénurie d’essence

  1. C’est ce genre d’initiative qui est une brique de plus pour la construction d’une France « open » ! Bravo pour les efforts fournis !

  2. Merci pour ce retour d’expérience fort intéressant !

    Je me permets deux remarques concernant l’état d’une station à un instant t :

    – beaucoup de sites d’info ont repris en brut la carte fournie par « mon-Essence », que j’ai trouvée un peu limitée car « juste » basée sur la bonne volonté de ses utilisateurs. Sans être ultra alarmiste et/ou pessimiste, on ne peut pas totalement écarter la possibilité qu’un utilisateur signale une station en pénurie pour la garder de côté !

    – le caractère éphémère d’une pénurie peut rendre la donnée vite périssable, j’en veux pour preuve le cas de l’Alsace où des assèchements ponctuels ont eu lieu à cause d’une fréquentation inhabituelle (http://www.rue89strasbourg.com/blocage-des-raffineries-pas-de-panique-alsace-107311). Du coup, un utilisateur de « mon-Essence » a pu en toute bonne foi marquer une station en pénurie, et cette dernière l’est restée alors qu’elle avait été réapprovisionnée depuis !

    Bref, la mise à jour efficace de ces données me semblent encore peu claires. Mais ce n’est pas pour ça qu’il faut baisser les bras ;-)

    1. Bonsoir Benjamin, Bonsoir Rapha. Merci d’avoir pris le temps de commenter cet article :)
      Pour les données de contribution, on reste sur les limites des systèmes contributifs de manière générale. Tant que la méthodologie est documentée, au moins on sait à quoi s’en tenir.

  3. Super travail !
    Y a t il une sorte de pétition pour essayer d’influencer les pouvoirs publics ?
    Un site pour enrichir les données de la base ?

    1. Bonjour Benoist,
      Cet article a en effet pour but d’influencer les pouvoirs publics. Tu viens de signer la pétition ; )
      Pour enrichir les données, tu peux soit créer une base et la publier par exemple sur data.gouv.Fr soit aussi le plus simple et fort utile: contribuer directement sur Openstreetmap. En renseignant les stations près de chez toi, l’information est directement disponible et exportable par tous.
      Si tu es sur Nantes, on continue l amélioration d OSM avec des sorties terrains, contacte nous pour participer.

      1. Merci pour ces réponses. je suis sur marseille mais je vais regarder pour contribuer localement.
        Bon courage à tous et merci

  4. Bravo et merci Libertic pour ce retour. Malgré les discours, l’open data opérationnel reste encore un parcours du combattant. Le mouvement révèle, finalement, la logique silo des « producteurs ». Il faut attendre 2014 pour voir apparaître une initiative comme BANO (1), 2016 pour BATO (2). Il faudra encore combien de temps pour que le citoyen se rende compte que les pouvoirs publics commencent à se réveiller d’un long cauchemar. Que ce sont les citoyens qui les ont réveillé, hélas, à l’occasion de situations de crise. Que ce cauchemar s’appelle démocratie, transparence, efficacité, réactivité.
    M’en fout de la pénurie d’essence, j’utilise principalement les transports en commun, mais je comprends que l’accès à cette information revêt un caractère préoccupant pour certains.
    Le fonctionnement en mode contributif, mieux, collaboratif n’est plus une alternative c’est et cela deviendra une nécessité. Nous avons tellement plus de moyens de communication que jamais et si peu d’envie de partager ces nouveaux « communs » ?

    Denis
    1. http://openstreetmap.fr/bano
    2. http://wiki.openstreetmap.org/wiki/WikiProject_France/WikiProject_Base_Arrets_Transports_Ouverte_%28BATO%29

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>