Nos références

Des missions co-développées avec les directions métiers de nos clients

Depuis sa création en 2013, DataStorm a mené de nombreuses missions d’expertise et de conseil pour des donneurs d’ordre privés et publics.
Notre volonté de développer des algorithmes maîtrisés grâce à la compréhension de leurs mécanismes et de leur domaine de validité, notre fierté à leur donner du sens, est une marque forte de DataStorm et du Groupe ENSAE. Nous la défendons avec conviction.
Toutes ces missions ont ainsi été co-développées avec les directions métiers de nos clients pour les accompagner dans leur compréhension et l’utilisation de leurs données.
Les conditions sont alors créées pour permettre à l’entreprise de bâtir ses propres équipes et devenir autonome sur sa stratégie data.

Addactis

Sfil

Orano

Yves Rocher

Vidal

Total

Sdis59

Legrand

APRR

Engie

Cerfrance

Jardiland

Air Liquide

Scores de churn

Au sein de la direction digitale d’Air Liquide, nous avons accompagné les équipes de la Data Factory pour mettre en oeuvre des scores de churn sur la population des clients achetant des gaz de l’air conditionnés en bouteilles. La difficulté vient ici de la faiblesse du signal de churn puisque la majorité des clients ne commandent que peu souvent des bouteilles pour rétablir leur stock au plus juste en fonction de leur propre activité. Les algorithmes mis en oeuvre ont permis de cibler des populations à risque de churn sur lesquelles les campagnes tests d’appel visant à décourager le churn ont démontré la pertinence de l’apport data de manière opérationnelle.

GRTgaz

Création d’un DataLab

Depuis 2016, GRTgaz, opérateur gérant la majorité du réseau de transport de gaz en France, a monté un DataLab avec pour objectif de mesurer l’apport des approches « data » pour les différents métiers. Datastorm a été sélectionné comme partenaire de ce DataLab et a pu réaliser différents projets sur des sujets aussi divers que la modélisation de la consommation par très grand froid, que la prévision à très court terme de la qualité du gaz en sortie des points livrant les industriels ou encore la simulation des flux réseaux à moyen terme pour le dimensionnement du réseau. Parmi ces sujets, Datastorm a travaillé avec la direction technique de GRTgaz sur des modèles prédictifs de la corrosion ou des atteintes au métal en vue d’optimiser la politique de maintenance opérationnelle (excavations pour rechercher des défauts sur les conduites et procéder à des réparations ou remplacements préventifs). L’approche mise en oeuvre repose sur des algorithmes de machine learning exploitant de manière géospatiale les données des différents systèmes d’information et des données externes (éléments influençant potentiellement l’équilibre cathodique des réseaux). Elle a permis d’augmenter sensiblement le taux de découverte. Au delà du POC mis en oeuvre, nous avons accompagné les équipes de GRTgaz pour l’industrialisation de ces algorithmes qui sont désormais utilisés en production pour la préparation des plans de fouille.

Enedis

Partenariat Scientifique

Après un audit mené par Datastorm en 2013, Enedis a souhaité conclure un partenariat scientifique de long terme pour bénéficier de l’expertise des chercheurs du groupe. Ce partenariat s’articule autour des problématiques de modélisation des courbes de charges des clients résidentiels, notamment dans le cadre de la mise en place de NEBEF et des marchés de capacités.

RTE

Projet Datalab

Dans le cadre de son projet SMARTLAB, RTE a souhaité bénéficier de l’infrastructure Big Data sécurisée mise en œuvre par le CASD pour expérimenter les solutions de gestion massive de données afin de croiser l’ensemble de ses données patrimoniales (ensemble des équipements du réseau haute tension), l’ensemble de ses données systèmes (ensemble des signaux de tension et puissance et des données externes (météo, sols, réseaux routiers et ferrés, etc.) pour mesurer l’apport en vue des programmes de maintenance prédictive. Le système mis en place a permis de développer un prototype exploitant un volume important de données (plus de 3 années d’historique) sous les technologies Hadoop, HBASE, R, Shiny, QGIS. Ce prototype est accessible à distance de manière ultra sécurisée au travers des SD-BOX fournies par le CASD, ce qui permet à des consultants et chercheurs externes à RTE d’y accéder.

Crédit Immobilier de France

Recouvrement de créances grâce au machine learning

Datastorm a développé un package complet pour optimiser la gestion du recouvrement de créances grâce au machine learning. Les collaborateurs du CIF utilisent un instrument de pilotage associé à un logiciel d’aide à la décision qui, ensemble, permettent de déterminer les meilleures options de recouvrement. Sur la base de cette première collaboration réussie avec Datastorm, le CIF envisage déjà les prochaines applications issues de l’utilisation d’algorithmes d’intelligence artificielle.

Generali

Appréhension des risques et des incertitudes

En partenariat avec Actuaris, Generali a demandé à DataStorm de formaliser les champs de pertinence des outils d’appréhension des risques utilisés par le secteur de l’assurance. Trois champs d’impact sont concernés : l’allocation stratégique d’actifs, où le nouveau contexte de taux bas pourrait limiter la pertinence des méthodes stochastiques usuelles ; le pilotage prudentiel, où la porosité entre risque de modèle et modèle de risque nécessite de mieux caractériser la marge d’erreur des outils réglementaires ; et les solutions d’assurance et de prévention, où la transposition d’une vision assureur à une vision assuré pourrait exiger un changement de paradigme.

Dans ce cadre, DataStorm participe à la chaire PARI.

BNP Paribas

Nouvelles techniques de machine learning pour le scoring

Les institutions bancaires ont toujours été précurseurs dans l’exploitation des données, en particulier pour le contrôle de leurs risques. Depuis les années 90, elles utilisent des modèles de scoring du risque, très souvent basés sur des régressions logistiques s’appuyant sur des agrégats bancaires (en-cours moyen mensuel, total des dépenses, etc.). BNP Paribas a demandé à Datastorm d’évaluer l’apport des nouvelles techniques de machine learning (random forest, algorithmes de boosting, réseaux de neurons profonds, etc.) pour cette activité de scoring. Partant du cas pratique d’un score de risque de défaut à court terme des ménages débiteurs, nous avons exploité le détail de l’ensemble des transactions bancaires d’un portefeuille de 800 000 comptes pour mesurer non seulement l’apport de ces méthodes, mais également l’apport procuré par les données détaillées en lieu et place d’agrégats. Nous avons pour cela utilisé le CASD qui a permis de monter un cluster de calcul intensif parfaitement sécurisé pour manipuler de telles données et nos équipes d’ingénieurs et de chercheurs ont pu mesurer l’apport de tels modèles et des données concernant la performance des scores. L’étude a mis en évidence un apport très significatif des nouveaux algorithmes qui est pour moitié du à leur capacité à travailler en très grande dimension et donc à pouvoir exploiter des données très détaillées, et pour moitié à leur gain de performance par rapport aux méthodes probabilistes. La question de l’interprétabilité des modèles et donc de leur acceptabilité par les organismes de contrôle a également fait l’objet d’une étude spécifique à cette occasion.

RATP

Approches Big Data pour la régulation

Mise en place d’un POC pour l’analyse des données de géolocalisation des bus et la détermination de nouveaux modèles de régulation. Etudes des impacts de la météo, des événements spéciaux, etc. sur la vitesse de progression et sur les temps de parcours. Mise en place d’une solution de détection automatique des parcours et des points de contention du trafic.

Le fil

Suivez notre actualité et nos projets

Insuffisance rénale : Datastorm a développé une application dédiée aux équipes médicales

Datastorm a développé une application qui permet aux équipes médicales de générer facilement des statistiques et indicateurs relatifs aux patients traités par dialyse à domicile. Un projet au service de la santé piloté par le Docteur Christian Verger, président et co-fondateur du Registre de Dialyse Péritonéale de Langue Française & Hémodialyse à Domicile. Interview.

Comment concilier Performance Business et Réglementation grâce à l’Anonymisation des données ?

Jeudi 24 septembre 2020 – 11h Lors de ce webinar, nous étudierons un cas concret d’anonymisation. Nous développerons la recherche d’un équilibre entre maîtrise des risques de fuites d’informations et conservation des capacités d’analyse. En lien avec notre Livre Blanc publié début septembre, nous verrons comment mettre en œuvre la méthode de la k-anonymisation. Nous verrons ensuite comment […]

R&D
Livre Blanc Datastorm : Déployer une procédure d’Anonymisation

Dans ce Livre Blanc, nous établissons les bases permettant de déployer une procédure générique et rigoureuse d’anonymisation : comment valoriser des données en respectant les contraintes imposées par le RGPD ? Comment préserver les données à caractère personnel ou sensibles de vos clients et collaborateurs sans réduire vos capacités d’analyse ? Comment auditer vos procédures d’anonymisation pour vous prémunir des risques juridiques ?

R&D
Enedis et Datastorm : l’économétrie et la recherche au service de la décision stratégique

La Direction de la Stratégie d’Enedis s’appuie sur les travaux économétriques de Datastorm pour mieux comprendre les phénomènes d’élasticité-prix de l’électricité. Laurent Gilotte, Chargé de mission Stratégie chez Enedis, nous éclaire sur l’apport de ces outils et méthodes dans l’aide à la décision. Laurent Gilotte, quel est le rôle de la Direction de la Stratégie […]

#07 Gestion des risques : SFIL optimise la Performance de ses Backtestings

Banque publique de développement et acteur majeur du financement de l’économie française, SFIL a choisi de concilier réponse règlementaire et efficacité opérationnelle en industrialisant ses backtestings. Datastorm a accompagné la Direction des risques de SFIL tout au long du processus.

Open innovation via le Business Data Challenge avec Cdiscount

Chez Datastorm, nous sommes fiers d’avoir assuré le pilotage opérationnel du Business Data Challenge ENSAE-Cdiscount. Un excellent moyen de faire entrer l’open innovation dans la stratégie data des entreprises. Pendant quatre mois, quatre groupes d’élèves de l’ENSAE ont mis leur expertise en Data Science et en Economie au service du pricing chez le leader français […]

Toute l'expertise du Groupe ENSAE-ENSAI

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
24 rue Barbès
92120 MONTROUGE - FRANCE