Cas clients

#01 Approche Big Data pour la Régulation des Bus

  • > Prise en charge, traitement et évaluation des données de localisations brutes des bus
  • > Analyse des temps de parcours et facteurs influants
  • > Conception d’un algorithme prédictif des temps de parcours

Think

Le département Bus de notre client coordonne environ 350 lignes de bus sur la région. Pour permettre la régulation du trafic en temps réel, les bus sont équipés de systèmes embarqués émettant leurs localisations brutes horodatées. Notre client souhaitait explorer la pertinence de ces données pour différents aspects métiers du service, allant de la conception à la régulation.

Cette étude s’est déroulée en 3 phases :

  1. Gestion et traitement des données brutes

  2. Elaboration d’une maquette de visualisation permettant d’explorer des statistiques liées aux temps de parcours de manière interactive

  3. Mise en œuvre et comparaison de différentes méthodes de modélisation des temps de parcours



GESTION ET TRAITEMENT DES DONNEES


Données disponibles :
données référentielles : les arrêts, les parcours et les tableaux de marche
données de localisation horodatées des bus émises toutes les minutes (en service) : ≈ 500Go/an

Traitement :
Nous avons utilisé des méthodes géospatiales (détection des courses, départ, arrivée, sens, détection des arrêts en station, mapmatching…) puis mis en forme et inséré les données dans une base MongoDB avec indexation spatio-temporelle hiérarchique.

ANALYSE DES TEMPS DE PARCOURS

Visualisation interactive des temps de parcours en fonction de l’heure de la journée et du jour, comprenant également les temps de parcours théoriques, les temps moyens (régression par LOESS) et les intervalles de confiances.



L’analyse des temps de parcours a pu déceler un bruit assez important dans les données. Néanmoins, en moyennant sur plusieurs semaines, les temps de parcours en fonction du temps et du jour sont stables.

Model

La partie modélisation de notre mission visait à prédire en temps réel le temps de parcours d’un bus de sa position actuelle vers un arrêt donné.

Notre second objectif a été d’implémenter le modèle SIEL de notre client et le comparer avec les nouveaux modèles proposés : modèles GAM, modèles de forêts aléatoires, mélanges.

Le nouveau modèle basé sur les forêts aléatoires génère 30 à 40% d’amélioration en moyenne sur l’algorithme existant.

Build

Nous avons mis en place une solution de détection automatique des parcours et des points de contention du trafic développée sous R Shiny.

Les cartes sont rendues grâce au plugin R leaflet et les graphiques interactifs grâce à plotly.

DataStorm adresse la chaîne complète de valeur Data des entreprises

De l’application des résultats des derniers travaux des chercheurs associés à l’ENSAE à la mise en production et à la maintenance de solutions permettant aux entreprises d’innover grâce à l’exploitation des données.

L'ingénierie

Nou vous accompagnons dans la mise en oeuvre des outis et applications vous permettant de valoriser vos leviers opérationnels.

La recherche appliquée

En fonction de vos projets, nous mobilisons les équipes de recherche du CREST et des laboratoires associés à Saclay et à Rennes.

L'expertise

Nous vous aidons à développer votre propre expertise data et machine learning, dédiée à vos métiers.

Toute l'expertise du groupe ENSAE

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
24 rue Barbès
92120 MONTROUGE - FRANCE