NewsRoom

La thèse d’Hassan Maissoro sur les données fonctionnelles

R&D 12 avril 2023

Hassan Maissoro est doctorant chez Datastorm. Rattaché au Crest-ENSAI, il travaille sur l’analyse des données fonctionnelles. Invité au Breizh Data Day, le jeune doctorant a partagé ses travaux avec la communauté data bretonne.

Pour aller plus loin

De quoi parle-t-on quand on parle de données fonctionnelles ?

L’idée s’applique lorsqu’on dispose d’un ensemble de séries temporelles, comme par exemple les mesures temporelles de capteurs, générées par un même mécanisme aléatoire. On peut alors se servir de l’information contenue sur chaque série, ainsi que celle disponible à travers les séries. Formellement, on considère que chaque série temporelle est le fruit de  la réalisation d’une seule variable aléatoire qui est une fonction, une trajectoire, une courbe. En adoptant cette perspective de modélisation il est possible de fortement réduire la dimension du problème en procédant à une décomposition parcimonieuse de ces fonctions, trajectoires, courbes, sur des bases bien choisies et surtout de pouvoir naturellement réconcilier des signaux dont l’échantillonnage temporel peut être différent et irrégulier.

Pourquoi Datastorm s’intéresse aujourd’hui de près à ce sujet ?

C’est un sujet encore peu exploré et peu utilisé dans un contexte industriel avec des données réelles. Or, avec le développement de l’IoT, il y a de vraies potentialités. Les quantités mesurées par les capteurs prennent en effet la forme de courbes aléatoires et les méthodes statistiques multivariées usuelles ne sont plus performantes pour exploiter ce type de données. Les méthodes et algorithmes issus de la statistique pour données fonctionnelles peuvent apporter de nouvelles pistes de modélisation pour la prévision ou l’analyse.

Des exemples d’application ?

Avec ses clients, Datastorm travaille depuis plusieurs années sur l’optimisation de la prévision de la production des énergies renouvelables qui utilise une quantité considérable de données. L’objectif est de tester des modèles et algorithmes de données fonctionnelles et voir comment ils apportent de nouveaux éléments de prévision par rapport à ce qui a déjà pu être mis en œuvre avec le boosting ou les réseaux de neurones.

 


Ressources