Cas clients
01.

Approche Big Data pour la Régulation des Bus

Prise en charge, traitement et évaluation des données de localisations brutes des bus
Analyse des temps de parcours et facteurs influants
Conception d’un algorithme prédictif des temps de parcours
Expertise
  • Analyse spatiale
  • Modélisation avancée
  • Datavisualisation
La mission

Le département Bus de notre client coordonne environ 350 lignes de bus sur la région. Pour permettre la régulation du trafic en temps réel, les bus sont équipés de systèmes embarqués émettant leurs localisations brutes horodatées. Notre client souhaitait explorer la pertinence de ces données pour différents aspects métiers du service, allant de la conception à la régulation.

Cette étude s’est déroulée en 3 phases :

  1. Gestion et traitement des données brutes
  2. Elaboration d’une maquette de visualisation permettant d’explorer des statistiques liées aux temps de parcours de manière interactive
  3. Mise en œuvre et comparaison de différentes méthodes de modélisation des temps de parcours

GESTION ET TRAITEMENT DES DONNEES

Données disponibles :

  • données référentielles : les arrêts, les parcours et les tableaux de marche
  • données de localisation horodatées des bus émises toutes les minutes (en service) : ≈ 500Go/an

Traitement :
Nous avons utilisé des méthodes géospatiales (détection des courses, départ, arrivée, sens, détection des arrêts en station, mapmatching…) puis mis en forme et inséré les données dans une base MongoDB avec indexation spatio-temporelle hiérarchique.

ANALYSE DES TEMPS DE PARCOURS

Visualisation interactive des temps de parcours en fonction de l’heure de la journée et du jour, comprenant également les temps de parcours théoriques, les temps moyens (régression par LOESS) et les intervalles de confiances.

L’analyse des temps de parcours a pu déceler un bruit assez important dans les données. Néanmoins, en moyennant sur plusieurs semaines, les temps de parcours en fonction du temps et du jour sont stables.

La solution

La partie modélisation de notre mission visait à prédire en temps réel le temps de parcours d’un bus de sa position actuelle vers un arrêt donné.

Notre second objectif a été d’implémenter le modèle SIEL de notre client et le comparer avec les nouveaux modèles proposés : modèles GAM, modèles de forêts aléatoires, mélanges.

Le nouveau modèle basé sur les forêts aléatoires génère 30 à 40% d’amélioration en moyenne sur l’algorithme existant.

Le résultat

Nous avons mis en place une solution de détection automatique des parcours et des points de contention du trafic développée sous R Shiny.

Les cartes sont rendues grâce au plugin R leaflet et les graphiques interactifs grâce à plotly.