Le fil

Indispensable : R pour la statistique et la science des données

Expertise - 12 novembre 2018
Benoit Thieurmel, responsable R&D de Datastorm, est l’un des dix co-auteurs de l’ouvrage « R pour la statistique et la science des données », publié aux Presses Universitaires de Rennes sous la direction de François Husson.
Le logiciel R est un outil incontournable de statistique, de visualisation de données et de science des données tant dans le monde universitaire que dans celui de l’entreprise. Ceci s’explique par ses trois principales qualités : il est gratuit, très complet et en essor permanent. Récemment, il a su s’adapter pour entrer dans l’ère du big data et permettre de recueillir et traiter des données hétérogènes et de très grandes dimensions (issues du Web, données textuelles, etc.).
Des cas concrets présentés sous forme de fiches balayent notamment un large spectre de techniques en traitement des données : intervalles de confiance et tests, procédures d’analyse factorielle, classification non supervisée, méthodes usuelles de régression, machine learning, gestion de données manquantes, analyse de texte, fouille de graphe… Indispensable !
R&D
Voici shinydrive, le dernier-né des packages Datastorm

Dans la famille des packages shiny de Datastorm, voici le petit dernier : shinydrive. Le package shinydrive a été développé pour répondre à un besoin simple : faciliter le partage de fichiers entre différents utilisateurs d’une application R/shiny.

R&D
Functional Data : un potentiel encore peu exploré

La dernière matinée R&D de Datastorm était notamment consacrée aux données fonctionnelles. Elles peuvent apporter de nouvelles pistes de modélisation pour la prévision ou l’analyse. Le point avec Benoit Ravel, CEO de Datastorm.

Replay webinar : Anticiper les dérives de vos Modèles de Machine Learning grâce au MLOps

La multiplication des projets data et des algorithmes expose les entreprises à un risque aujourd’hui clairement identifié : la baisse de performance des modèles de Machine Learning. Il est pourtant capital d’anticiper les dérives de vos modèles et le Machine Learning Operations (MLOps) peut vous y aider. Dans ce nouveau webinaire, les équipes de Datastorm vous expliquent comment.

Toute l'expertise du Groupe ENSAE-ENSAI

Plateau de Saclay
5 Avenue Henry-Le-Chatelier
91120 PALAISEAU - FRANCE

Paris
24 rue Barbès
92120 MONTROUGE - FRANCE