Nos références

Des missions co-développées avec les directions métiers de nos clients

Depuis sa création en 2013, DataStorm a mené de nombreuses missions d’expertise et de conseil pour des donneurs d’ordre privés et publics.
Notre volonté de développer des algorithmes maîtrisés grâce à la compréhension de leurs mécanismes et de leur domaine de validité, notre fierté à leur donner du sens, est une marque forte de DataStorm et du Groupe ENSAE. Nous la défendons avec conviction.
Toutes ces missions ont ainsi été co-développées avec les directions métiers de nos clients pour les accompagner dans leur compréhension et l’utilisation de leurs données.
Les conditions sont alors créées pour permettre à l’entreprise de bâtir ses propres équipes et devenir autonome sur sa stratégie data.

RATP

Approches Big Data pour la régulation

Mise en place d’un POC pour l’analyse des données de géolocalisation des bus et la détermination de nouveaux modèles de régulation. Etudes des impacts de la météo, des événements spéciaux, etc. sur la vitesse de progression et sur les temps de parcours. Mise en place d’une solution de détection automatique des parcours et des points de contention du trafic.

BNP Paribas

Nouvelles techniques de machine learning pour le scoring

Les institutions bancaires ont toujours été précurseurs dans l’exploitation des données, en particulier pour le contrôle de leurs risques. Depuis les années 90, elles utilisent des modèles de scoring du risque, très souvent basés sur des régressions logistiques s’appuyant sur des agrégats bancaires (en-cours moyen mensuel, total des dépenses, etc.). BNP Paribas a demandé à Datastorm d’évaluer l’apport des nouvelles techniques de machine learning (random forest, algorithmes de boosting, réseaux de neurons profonds, etc.) pour cette activité de scoring. Partant du cas pratique d’un score de risque de défaut à court terme des ménages débiteurs, nous avons exploité le détail de l’ensemble des transactions bancaires d’un portefeuille de 800 000 comptes pour mesurer non seulement l’apport de ces méthodes, mais également l’apport procuré par les données détaillées en lieu et place d’agrégats. Nous avons pour cela utilisé le CASD qui a permis de monter un cluster de calcul intensif parfaitement sécurisé pour manipuler de telles données et nos équipes d’ingénieurs et de chercheurs ont pu mesurer l’apport de tels modèles et des données concernant la performance des scores. L’étude a mis en évidence un apport très significatif des nouveaux algorithmes qui est pour moitié du à leur capacité à travailler en très grande dimension et donc à pouvoir exploiter des données très détaillées, et pour moitié à leur gain de performance par rapport aux méthodes probabilistes. La question de l’interprétabilité des modèles et donc de leur acceptabilité par les organismes de contrôle a également fait l’objet d’une étude spécifique à cette occasion.

Generali

Appréhension des risques et des incertitudes

En partenariat avec Actuaris, Generali a demandé à DataStorm de formaliser les champs de pertinence des outils d’appréhension des risques utilisés par le secteur de l’assurance. Trois champs d’impact sont concernés : l’allocation stratégique d’actifs, où le nouveau contexte de taux bas pourrait limiter la pertinence des méthodes stochastiques usuelles ; le pilotage prudentiel, où la porosité entre risque de modèle et modèle de risque nécessite de mieux caractériser la marge d’erreur des outils réglementaires ; et les solutions d’assurance et de prévention, où la transposition d’une vision assureur à une vision assuré pourrait exiger un changement de paradigme.
Dans ce cadre, DataStorm participe à la chaire PARI.

Crédit Immobilier de France

Recouvrement de créances grâce au machine learning

Datastorm a développé un package complet pour optimiser la gestion du recouvrement de créances grâce au machine learning. Les collaborateurs du CIF utilisent un instrument de pilotage associé à un logiciel d’aide à la décision qui, ensemble, permettent de déterminer les meilleures options de recouvrement. Sur la base de cette première collaboration réussie avec Datastorm, le CIF envisage déjà les prochaines applications issues de l’utilisation d’algorithmes d’intelligence artificielle.

RTE

Projet Datalab

Dans le cadre de son projet SMARTLAB, RTE a souhaité bénéficier de l’infrastructure Big Data sécurisée mise en œuvre par le CASD pour expérimenter les solutions de gestion massive de données afin de croiser l’ensemble de ses données patrimoniales (ensemble des équipements du réseau haute tension), l’ensemble de ses données systèmes (ensemble des signaux de tension et puissance et des données externes (météo, sols, réseaux routiers et ferrés, etc.) pour mesurer l’apport en vue des programmes de maintenance prédictive. Le système mis en place a permis de développer un prototype exploitant un volume important de données (plus de 3 années d’historique) sous les technologies Hadoop, HBASE, R, Shiny, QGIS. Ce prototype est accessible à distance de manière ultra sécurisée au travers des SD-BOX fournies par le CASD, ce qui permet à des consultants et chercheurs externes à RTE d’y accéder.

Enedis

Partenariat Scientifique

Après un audit mené par Datastorm en 2013, Enedis a souhaité conclure un partenariat scientifique de long terme pour bénéficier de l’expertise des chercheurs du groupe. Ce partenariat s’articule autour des problématiques de modélisation des courbes de charges des clients résidentiels, notamment dans le cadre de la mise en place de NEBEF et des marchés de capacités.

GRTgaz

Création d’un DataLab

Depuis 2016, GRTgaz, opérateur gérant la majorité du réseau de transport de gaz en France, a monté un DataLab avec pour objectif de mesurer l’apport des approches « data » pour les différents métiers. Datastorm a été sélectionné comme partenaire de ce DataLab et a pu réaliser différents projets sur des sujets aussi divers que la modélisation de la consommation par très grand froid, que la prévision à très court terme de la qualité du gaz en sortie des points livrant les industriels ou encore la simulation des flux réseaux à moyen terme pour le dimensionnement du réseau. Parmi ces sujets, Datastorm a travaillé avec la direction technique de GRTgaz sur des modèles prédictifs de la corrosion ou des atteintes au métal en vue d’optimiser la politique de maintenance opérationnelle (excavations pour rechercher des défauts sur les conduites et procéder à des réparations ou remplacements préventifs). L’approche mise en oeuvre repose sur des algorithmes de machine learning exploitant de manière géospatiale les données des différents systèmes d’information et des données externes (éléments influençant potentiellement l’équilibre cathodique des réseaux). Elle a permis d’augmenter sensiblement le taux de découverte. Au delà du POC mis en oeuvre, nous avons accompagné les équipes de GRTgaz pour l’industrialisation de ces algorithmes qui sont désormais utilisés en production pour la préparation des plans de fouille.

Edenred

Modèles économétriques et algorithmes par graphe

Inventeur de Ticket Restaurant®, Edenred est le leader mondial des services prépayés aux entreprises. Depuis avril 2014, les titres-restaurant peuvent être émis sur support papier ou sous forme dématérialisée : carte à puce rechargeable ou application sur smartphone. Les équipes d’Edenred souhaitent savoir si l’exploitation des données issues de la digitalisation pouvait augmenter la proposition de valeur que l’entreprise propose à ses différents interlocuteurs, affiliés et bénéficiaires. Les modèles économétriques développés par Datastorm ont permis de mesurer parfaitement l’impact de la digitalisation sur l’activité d’Edenred. La mise en place d’algorithmes par graphe a permis de détecter des communautés bénéficiaires et d’identifier des « leaders » semblant drainer avec eux des populations. Le projet a permis de conclure que la digitalisation de Ticket Restaurant® est bénéfique pour Edenred et lui permet d’ouvrir de nouvelles perspectives.

Air Liquide

Scores de churn

Au sein de la direction digitale d’Air Liquide, nous avons accompagné les équipes de la Data Factory pour mettre en oeuvre des scores de churn sur la population des clients achetant des gaz de l’air conditionnés en bouteilles. La difficulté vient ici de la faiblesse du signal de churn puisque la majorité des clients ne commandent que peu souvent des bouteilles pour rétablir leur stock au plus juste en fonction de leur propre activité. Les algorithmes mis en oeuvre ont permis de cibler des populations à risque de churn sur lesquelles les campagnes tests d’appel visant à décourager le churn ont démontré la pertinence de l’apport data de manière opérationnelle.

Le fil

Suivez notre actualité et nos projets

R&D
Frank Rimek rejoint Datastorm

Data scientist expérimenté, Frank Rimek rejoint Datastorm comme Directeur R&D – Project Manager. Après un début de carrière à la tête d’un service d’appui Analytics de la division Recherche & Innovation de L’Oréal, Frank Rimek a pris le chemin du conseil où il a pu déployer des solutions de traitement de données dans de nombreux […]

Indispensable : R pour la statistique et la science des données

Benoit Thieurmel, responsable R&D de Datastorm, est l’un des dix co-auteurs de l’ouvrage « R pour la statistique et la science des données », publié aux Presses Universitaires de Rennes sous la direction de François Husson. Le logiciel R est un outil incontournable de statistique, de visualisation de données et de science des données tant […]

L’intelligence artificielle : fiction ou actions ?

Lire l’article complet sur Variance, le webzine de ENSAE Alumni. « L’essentiel des fonctions du véhicule de demain ne sera pas lié au fait de conduire ». Guillaume Devauchelle et Vanessa Picron, directeur de l’Innovation et directrice Driving Assistance Research de Valeo partagent leur analyse du rôle de l’IA dans l’industrie automobile lors du colloque […]

CIF : l’IA pour améliorer le recouvrement des créances immobilières

CIF : l’IA pour améliorer le recouvrement des créances immobilières Cet article a été publié dans la Revue Banque n°820 de mai 2018 Lisez l’article complet Datastorm a développé un package complet pour optimiser la gestion du recouvrement de créances grâce au machine learning. Les collaborateurs du Crédit Immobilier de France utilisent un instrument de […]

Le transport optimal appliqué au machine learning

Sujet de mathématiques pures depuis le XVIIIe siècle et les travaux de Gaspard Monge, le transport optimal connaît un renouveau spectaculaire avec les avancées en machine learning. L’éclairage de Marco Cuturi Professeur de Statistique à l’ENSAE.

RTE : web-application Shiny pour optimiser les travaux sous tension

DataStorm a développé un outil statistique d’aide à la décision moderne et rapide pour un accès pratique et ergonomique aux données et aux résultats. En France, l’activité de transport-distribution d’électricité est assurée par deux filiales d’EDF : RTE et ENEDIS. RTE assure le transport et ENEDIS la distribution sur l’ensemble du territoire français, le plus grand […]

Toute l'expertise du groupe ENSAE

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
60 rue Etienne-Dolet
92240 MALAKOFF - FRANCE