La chaire DSAIDIS vient d’accueillir 6 nouveaux stagiaires : Yousef Tahiri Sojasi, Junjie Yang, Tamim El Ahmad, Oskar Rynkiewicz, Orson Jay et Halim Hizaoui. Nous vous proposons de découvrir les sujets sur lesquels ils vont travailler pendant leur stage.

Tamim El Ahmad est étudiant au master 2 Mathématique, Vision, Apprentissage (MVA) de l’ENS Paris-Saclay spécialisé en apprentissage automatique et en vision par ordinateur. Il est un ancien élève du master 1 de Mathématiques appliquées à Paris-Diderot et du cycle d’ingénieur des Mines Saint-Etienne.

Pendant son stage, il s’intéressera au développement d’architectures hybrides mêlant réseaux de neurones et modèles à noyaux pour résoudre des problèmes de prédiction de données structurées (notamment prédiction de liens, prédiction de séquences et de graphes). Il sera encadré par Florence d’Alché-Buc, professeure à Télécom Paris et titulaire de la chaire DSAIDIS.

 

 

Junjie Yang est étudiant en master 2 à l’École d’Ingénieurs ParisTech Shanghai Jiao Tong (SJTU-ParisTech). Il y a déjà effectué des recherches sur le traitement automatique du langage, en particulier autour de « Question Answering » et « Natural Language Understanding » via l’apprentissage statistique.

Au cours de son stage, il s’intéressera à l’application de plusieurs familles de méthodes de la prédiction de sortie structurée aux données textuelles, et notamment à la génération de texte qui comprend un nombre important de tâches potentiellement très différentes (Abstractive Summarization, Question Answering, Automatic Image Description, Machine Translation…). Il sera encadré par Matthieu Labeau, maître de conférence à Télécom Paris et par Florence d’Alché-Buc.

 

Oskar Rynkiewicz est étudiant au master Intelligence Artificielle, Systèmes, Données (IASD) à l’université Paris Dauphine-PSL et a obtenu son diplôme d’ingénieur à l’IMT Atlantique. Il s’intéresse à l’optimisation et à l’apprentissage automatique.

Au cours de son stage, il s’appliquera à obtenir une borne inférieure d’algorithmes primal-dual sur les problèmes d’optimisation convexes à contraintes affines sous l’hypothèse de sous-régularité métrique. Une fois obtenue, la borne inférieure vérifiera l’optimalité des méthodes actuellement utilisées en ce qui concerne la sous-régularité métrique. Il sera encadré par Olivier Fercoq, maître de conférences à Télécom Paris.

 

Orson Jay est étudiant à l’Ecole Centrale de Nantes en master 1 Statistiques et Science des données.

Pendant son stage il étudiera les compétences générales recherchées aux entretiens d’embauches différés par une méthode d’analyse de corpus. Il sera également amené à étudier la littérature récente sur les modèles multi-labels et les méthodes de représentation de labels ainsi qu’à implémenter des réseaux de neurones récurrents basés sur des unités LSTM ou GRU pour la résolution de problème de multi-labels. Il sera encadré par Chloé Clavel, professeure à Télécom Paris et Léo Hemamou, doctorant de Télécom Paris

 

Yousef Tahiri Sojasi est passionné d’apprentissage statistique et  de traitement du langage naturel.

Pendant son stage, il travaillera sur le développement de méthodes de représentation de mots de manière à faciliter la détection de signaux faibles sur des données textuelles.  La détection de signaux faibles est l’un des enjeux majeurs sur le plan applicatif. La méthode est inspirée par approches et critères fondés sur la théorie des valeurs extrêmes ayant permis d’étendre les techniques d’apprentissage supervisé ou non supervisé. Il sera encadré par Stephan Clémençon, professeur à Télécom Paris et Matthieu Labeau, maître de conférences à Télécom Paris.

 

Halim Hizaoui est élève-ingénieur en intelligence artificielle à l’ENSTA Paris au sein d’un parcours menant à l’obtention d’un double diplôme ENSTA-ENIT (Ecole nationale d’ingénieurs de Tunis). Il est passionné par la finance et le machine learning.

Pendant son stage, il développera une méthode de classification supervisée inspirée du classifieur DDalpha (R-package ddalpha). Le classifieur DDalpha se base sur le Data Depth et l’Alpha-procedure. Il a l’avantage d’être non paramétrique, rapide et robuste. L’alpha-procedure est une heuristique itérative qui permet d’obtenir un espace fini de variables pertinentes. Grâce à cette nature récursive, l’optimisation de la fonction loss se fait en un temps de calculs réduit.  La combinaison Data Depth et Alpha-procedure donne des résultats prometteurs qui encouragent à développer davantage cette méthode côté heuristique. Le stage sera donc consacré à poursuivre les recherches sur l’Alpha-procedure. Des bases de données réelles et synthétiques seront testées en vue de déterminer les paramètres optimaux selon chaque configuration et de fournir une aide à la décision pour le choix de ces paramètres. Il sera encadré par Pavlo Mozharovskyi, professeur associé à Télécom Paris.