Le fil

Indispensable : R pour la statistique et la science des données

Expertise - 12 novembre 2018
Benoit Thieurmel, responsable R&D de Datastorm, est l’un des dix co-auteurs de l’ouvrage « R pour la statistique et la science des données », publié aux Presses Universitaires de Rennes sous la direction de François Husson.
Le logiciel R est un outil incontournable de statistique, de visualisation de données et de science des données tant dans le monde universitaire que dans celui de l’entreprise. Ceci s’explique par ses trois principales qualités : il est gratuit, très complet et en essor permanent. Récemment, il a su s’adapter pour entrer dans l’ère du big data et permettre de recueillir et traiter des données hétérogènes et de très grandes dimensions (issues du Web, données textuelles, etc.).
Des cas concrets présentés sous forme de fiches balayent notamment un large spectre de techniques en traitement des données : intervalles de confiance et tests, procédures d’analyse factorielle, classification non supervisée, méthodes usuelles de régression, machine learning, gestion de données manquantes, analyse de texte, fouille de graphe… Indispensable !
R&D
Matinée R&D avec Eric Matzner-Lober et Nick Hengartner

Les équipes de DataStorm ont présenté leurs travaux de R&D interne à Eric Matzner-Lober et Nick Hengartner, deux chercheurs reconnus bien au-delà de leur communauté. Deep learning, réseaux antagonistes, NLP, interprétabilité des algorithmes de machine learning… ces regards croisés vont alimenter le plan R&D 2019 de DataStorm. Exigeante, riche et réciproque. Voilà comment qualifier la […]

« DataStorm est au cœur du réacteur français de l’Intelligence Artificielle »

Installée dans le quartier de l’Ecole polytechnique, sur le Plateau de Saclay, DataStorm bénéficie d’un environnement scientifique fertile qui va de l’analyse économique aux systèmes intelligents. Une position unique qui permet à la filiale d’expertise et de conseil de l’ENSAE de mettre l’innovation au centre de ses projets clients. Dès sa création en 2013, DataStorm […]

[Voir ou revoir] : Les Enjeux du Big Data pour l’Assurance

Le 15 janvier dernier à Sciences Po, la chaire PARI lançait officiellement son programme de recherche 2018-2021. La Conférence inaugurale réunissait notamment Maud Bailly et Gilles Babinet autour des enjeux du Big Data pour l’assurance. Le Big Data, dit-on, va changer le monde. Les modèles explicatifs développés par l’économie ou la psychologie depuis des décennies […]

Toute l'expertise du groupe ENSAE

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
60 rue Etienne-Dolet
92240 MALAKOFF - FRANCE