Le fil

BNP Paribas

- 25 février 2019

Les institutions bancaires ont toujours été précurseurs dans l’exploitation des données, en particulier pour le contrôle de leurs risques. Depuis les années 90, elles utilisent des modèles de scoring du risque, très souvent basés sur des régressions logistiques s’appuyant sur des agrégats bancaires (en-cours moyen mensuel, total des dépenses, etc.). BNP Paribas a demandé à Datastorm d’évaluer l’apport des nouvelles techniques de machine learning (random forest, algorithmes de boosting, réseaux de neurons profonds, etc.) pour cette activité de scoring. Partant du cas pratique d’un score de risque de défaut à court terme des ménages débiteurs, nous avons exploité le détail de l’ensemble des transactions bancaires d’un portefeuille de 800 000 comptes pour mesurer non seulement l’apport de ces méthodes, mais également l’apport procuré par les données détaillées en lieu et place d’agrégats. Nous avons pour cela utilisé le CASD qui a permis de monter un cluster de calcul intensif parfaitement sécurisé pour manipuler de telles données et nos équipes d’ingénieurs et de chercheurs ont pu mesurer l’apport de tels modèles et des données concernant la performance des scores. L’étude a mis en évidence un apport très significatif des nouveaux algorithmes qui est pour moitié du à leur capacité à travailler en très grande dimension et donc à pouvoir exploiter des données très détaillées, et pour moitié à leur gain de performance par rapport aux méthodes probabilistes. La question de l’interprétabilité des modèles et donc de leur acceptabilité par les organismes de contrôle a également fait l’objet d’une étude spécifique à cette occasion.

Insuffisance rénale : Datastorm a développé une application dédiée aux équipes médicales

Datastorm a développé une application qui permet aux équipes médicales de générer facilement des statistiques et indicateurs relatifs aux patients traités par dialyse à domicile. Un projet au service de la santé piloté par le Docteur Christian Verger, président et co-fondateur du Registre de Dialyse Péritonéale de Langue Française & Hémodialyse à Domicile. Interview.

Comment concilier Performance Business et Réglementation grâce à l’Anonymisation des données ?

Jeudi 24 septembre 2020 – 11h Lors de ce webinar, nous étudierons un cas concret d’anonymisation. Nous développerons la recherche d’un équilibre entre maîtrise des risques de fuites d’informations et conservation des capacités d’analyse. En lien avec notre Livre Blanc publié début septembre, nous verrons comment mettre en œuvre la méthode de la k-anonymisation. Nous verrons ensuite comment […]

R&D
Livre Blanc Datastorm : Déployer une procédure d’Anonymisation

Dans ce Livre Blanc, nous établissons les bases permettant de déployer une procédure générique et rigoureuse d’anonymisation : comment valoriser des données en respectant les contraintes imposées par le RGPD ? Comment préserver les données à caractère personnel ou sensibles de vos clients et collaborateurs sans réduire vos capacités d’analyse ? Comment auditer vos procédures d’anonymisation pour vous prémunir des risques juridiques ?

Toute l'expertise du Groupe ENSAE-ENSAI

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
24 rue Barbès
92120 MONTROUGE - FRANCE