Le fil

Indispensable : R pour la statistique et la science des données

Expertise - 12 novembre 2018
Benoit Thieurmel, responsable R&D de Datastorm, est l’un des dix co-auteurs de l’ouvrage « R pour la statistique et la science des données », publié aux Presses Universitaires de Rennes sous la direction de François Husson.
Le logiciel R est un outil incontournable de statistique, de visualisation de données et de science des données tant dans le monde universitaire que dans celui de l’entreprise. Ceci s’explique par ses trois principales qualités : il est gratuit, très complet et en essor permanent. Récemment, il a su s’adapter pour entrer dans l’ère du big data et permettre de recueillir et traiter des données hétérogènes et de très grandes dimensions (issues du Web, données textuelles, etc.).
Des cas concrets présentés sous forme de fiches balayent notamment un large spectre de techniques en traitement des données : intervalles de confiance et tests, procédures d’analyse factorielle, classification non supervisée, méthodes usuelles de régression, machine learning, gestion de données manquantes, analyse de texte, fouille de graphe… Indispensable !
Replay webinar : Comment concilier Performance business et Règlementation grâce à l’Anonymisation des données ?

Pourquoi anonymiser ? Choix de la méthode ? Comment mettre en oeuvre la k-anonymisation ? Comment outiller un département/une activité pour mener des études avec la confidentialité différentielle ? Dans ce webinar animé par Benoit Ravel, Thibaut Dubois et Martin Masson partagent leur expertise et vous expliquent comment trouver le point d’équilibre entre la maîtrise des risques d’identification et la conservation des capacités d’analyse et de valorisation des données.

« Les métiers de la data et de l’IA ne viennent pas assez à la rencontre des femmes »

Naomi Girard a rejoint la team Datastorm en 2018. Data scientist junior, elle explore toutes les facettes du métier avec un intérêt prononcé pour le Traitement du Langage Naturel et un avis éclairé sur les femmes dans la data. Rencontre.

Les exigences d’une Data Literacy réussie

Acculturer pour embarquer. Pour une entreprise, la Data Literacy est un levier puissant qui permet de partager une lecture et une compréhension commune des concepts, enjeux, processus et outils de la Data Science. Dans cet article, Benoit Ravel revient sur les incontournables de cette démarche.

Toute l'expertise du Groupe ENSAE-ENSAI

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
24 rue Barbès
92120 MONTROUGE - FRANCE