Titulaire de la chaire

Florence d'Alché-Buc

Florence d'Alché-Buc

Professeure à Télécom Paris

Avant de rejoindre Télécom Paris en 2014, Florence d'Alché-Buc était professeure à l’Université d’Evry, titulaire d’une ATIGE et directrice adjointe du laboratoire IBISC. Elle a initié et porté le programme Challenges au sein du réseau d'excellence européen PASCAL (2004-08) et est depuis 2017 responsable scientifique du Labex Digicosme. Ses recherches portent sur l’apprentissage statistique, l’inférence de réseaux, la prédiction structurée et la modélisation de systèmes dynamiques. Elle est auteur de plus de 80 publications dans des journaux ou conférences internationales.

Dans son activité d’enseignement, Florence d’Alché-Buc est co-responsable du Master 2 « DataScience » de l’Université Paris-Saclay, co-habilité avec l’École Polytechnique, l’ENSAE Paris et l’Université Paris Sud. Elle a participé à la création des nouvelles formations continues en intelligence artificielle : le Mastère Spécialisé "Intelligence Artificielle" et le Certificat d’Etudes Spécialisées "Intelligence Artificielle". Elle est également responsable de la chaire d’enseignement BearingPoint « Pédagogie des Sciences de la Donnée ».

Mots-clés : apprentissage statistique, méthodes à noyaux, prédiction structurée, inférence de réseaux, systèmes dynamiques.

Voir son site

Référents pour les axes

Chloé Clavel

Chloé Clavel

Professeur à Télécom Paris

Chloé Clavel est enseignante et chercheuse à Télécom Paris où elle coordonne le thème Social Computing . Elle travaille actuellement sur les interactions entre humains et agents virtuels, de l’analyse du comportement socio-affectif de l’utilisateur aux stratégies d’interaction socio-affective. Elle a participé à plusieurs projets européens et nationaux collaboratifs autour du Social Computing (ex: H2020 ITN ANIMATAS, aria-valuspa UE-TIC, Labex smart).

Mots-clés : analyse des opinions, traitement automatique du langage naturel, apprentissage, traitement de la parole, reconnaissance des émotions, interaction humain-agent.

Voir son site

Stephan Clémençon

Stephan Clémençon

Professeur à Télécom Paris

Stephan Clémençon anime l’équipe de recherche S2A (Signal, Statistique et Apprentissage) au sein du laboratoire LTCI. Il effectue ses travaux de recherche en mathématiques appliquées au Laboratoire LTCI de Télécom Paris. Ses thématiques de recherche se situent principalement dans les domaines de l’apprentissage statistique, des probabilités et des statistiques. Il est responsable du Mastère Spécialisé « Big Data » à Télécom Paris et a été titulaire de la chaire industrielle « Machine Learning for Big Data » de 2013 à 2018.

Mots-clés : ranking, clustering, détection d'anomalie, fouille de graphes, moteurs de recommandation.

Voir son site

Pavlo Mozharovskyi

Pavlo Mozharovskyi

Maître de conférences à Télécom Paris

Pavlo Mozharovskyi a rejoint Télécom Paris en 2018. Après ses études dans L’institut polytechnique de Kiev dans le département Automatisation et informatique, il a obtenu son doctorat à l’Université de Cologne en 2014, où il a mené des recherches sur la statistique non-paramétrique et computationnelle et la classification. Il a occupé la fonction de post-doctorant dans le Centre Henri Lebesgue d’Agrocampus Ouest Rennes pendant un an, étudiant l’imputation des données manquantes, et a ensuite rejoint le laboratoire CREST de L’École nationale de la statistique et de l’analyse de l’information. Ses domaines de recherche principaux résident dans la profondeur statistique des données, la classification, la statistique computationnelle, la statistique robuste, les données manquantes et l’analyse par enveloppement des données.

Mots-clés : Profondeur des données, Statistique computationnelle, Statistique robuste, Données manquantes, Analyse par enveloppement des données.

Voir son site

François Portier

François Portier

Maître de Conférences à Télécom Paris

François Portier travaille au sein de l’équipe S2A du LTCI de Télécom Paris. Il a réalisé son doctorat sur les modèles prédictifs parcimonieux à l’Université de Rennes 1. Il a effectué, par la suite, un post-doctorat FNRS à l’Université catholique de Louvain durant lequel il a étudié certains modèles d’analyse de survie. Ses thèmes de recherche portent aujourd’hui sur les méthodes de Monte-Carlo séquentielles, l’apprentissage pour données censurées et dépendantes, les modèles prédictifs parcimonieux.

Mots-clés : échantillonnage d’importance adaptatif, MCMC, Bootstrap, chaine de Markov, réduction de la dimension, analyse de survie.

Voir son site

François Roueff

François Roueff

Professeur à Télécom Paris

François Roueff travaille au sein de l’équipe de recherche S2A du LTCI et est directeur adjoint de l'école doctorale de mathématiques Hadamard. Ses thèmes de recherche se situent principalement dans les domaines du traitement statistique du signal, de l'analyse et la modélisation aléatoire des séries temporelles et des statistiques pour les processus stochastiques.

Mots-clés : longue dépendance, analyse en ondelettes, processus de Hawkes, processus localement stationnaires.

Voir son site

Anne Sabourin

Anne Sabourin

Maître de Conférences à Télécom Paris

Anne Sabourin est Maître de Conférences au sein de l’équipe S2A de Télécom Paris depuis 2013. Elle a obtenu son doctorat en 2013 sur les valeurs extrêmes multivariées et l'inférence bayésienne à l'Université Lyon 1, sous la direction d'Anne-Laure Fougères et Philippe Naveau. Ses objets de recherche concernent la théorie des valeurs extrêmes multivariées, la dépendance entre les événements rares, la réduction des dimensions dans les régions extrêmes, avec diverses applications allant des risques environnementaux aux applications en apprentissage automatique telles que la détection d'anomalies.

Mots-clés : théorie des valeurs extrêmes multivariées, événements rares, réduction de dimension, détection d'anomalies.

Voir son site

Giovanna Varni

Giovanna Varni

Maître de Conférences à Télécom Paris

Arrivée à Télécom Paris en 2017, ses activités de recherche portent sur le domaine du socio-affective computing. Auparavant, Giovanna Varni était chercheuse postdoctorale à l’Université de Gênes (Italie) dans l’équipe InfoMus Lab, puis dans l’équipe INTERACTION (groupe IMI2S) au sein de l’Université Pierre et Marie Curie à Paris 6. Ses travaux s’intéressent à l’analyse des signaux multimodaux non verbaux dans l’interaction homme-homme et homme-machine. Elle a été impliqué depuis 2006 dans plusieurs projets européens (FP7 ; EU-ICT ; STREP et FET).

Mots-clés : interaction homme-homme et homme-machine, socio-affective signal processing, synchronie interpersonnelle, geste expressif.

Voir son site

Membres permanents

Roland Badeau

Roland Badeau

Professeur à Télécom Paris

Roland Badeau est professeur dans l’équipe Signal, Statistiques et Apprentissage dans le département Image, Données, Signal (IDS) de Télécom Paris. Ses travaux de recherche portent sur la modélisation statistique de signaux non-stationnaires (en allant de l’analyse spectrale haute-résolution et adaptative et les extensions bayésiennes de la factorisation en matrices non-négatives), avec des applications en acoustique et en musique (séparation de sources audio, débruitage, déréverbération, estimation de fréquences fondamentales multiples, transcription musicale automatique, codage audio, restauration de contenu musical). Il est le co-auteur d’une trentaine d’articles, plus de 100 comptes rendus de conférences et 4 brevets. Il est également Éditeur associé des revues « EURASIP Journal on Audio, Speech, and Music Processing » et « IEEE/ACM Transactions on Audio, Speech, and Language Processing ».

Mots-clés : représentation des données, modélisation, algorithmes, traitement du signal audio.

Voir son site

Pascal Bianchi

Pascal Bianchi

Professeur à Télécom Paris

Pascal Bianchi est né en 1977. Il est titulaire d’un Master en Sciences de l'Université de Paris XI et de Supélec en 2000 et d’un doctorat de l'Université de Marne-la-Vallée en 2003. De 2003 à 2009, il était Maître de Conférences au Département des télécommunications de Supélec. En 2009, il a rejoint l’équipe Signal, Statistiques et Apprentissage (S2A) du LTCI de Télécom Paris. Ses intérêts de recherche actuels se trouvent dans le domaine de l'optimisation stochastique, les probabilités et le traitement du signal.

Mots-clés : traitement statistique du signal, optimisation convexe, optimisation distribuée, réseaux de capteurs.

Voir son site

Albert Bifet

Albert Bifet

Professeur à Télécom Paris

Albert Bifet est l'un des leaders des environnements MOA et Apache SAMOA pour l'implémentation des algorithmes et l’expérimentation de l'apprentissage en ligne depuis des flux de données évolutifs. Il est l'auteur d'un livre sur la fouille de flux adaptative et sur l'apprentissage et la fouille de modèles depuis les flux de données évolutifs. Précédemment, il a travaillé au sein du Noah’s Ark Lab de Huawei à Hong Kong, au Yahoo Labs de Barcelone, à l'Université de Waikato et à l'UPC BarcelonaTech. Il était co-chair du parcours industriel de l'IEEE MDM 2016, de l'ECML PKDD 2015, de BigMine (2012-2018) et du parcours Flux de Données de l'ACM SAC (2012-2019).

Mots-clés : intelligence artificielle, flux de données, Internet des objets, analytique en temps réel, apprentissage statistique, fouille de graphes

Voir son site

Thomas Bonald

Thomas Bonald

Professeur à Télécom Paris

Thomas Bonald est Professeur à Télécom Paris et anime l'équipe de recherche DIG (Data, Intelligence et Graphes). Ses activités de recherche portent sur l’analyse de graphes. Il anime notamment le projet Scikit-network, une librairie Python dédiée à l’analyse des grands graphes. Il s’intéresse également aux séries temporelles multi-variées et au traitement naturel du langage.

Mots-clés : Grands graphes, méthodes spectrales, clustering, systèmes de recommandation.

Voir son site

Slim Essid

Slim Essid

Professeur à Télécom Paris

Slim Essid coordonne le thème de recherche « traitement du signal et analyse de données audio » (ADASP). Ses travaux s'intéressent à l’intelligence artificielle et l'apprentissage automatique pour le traitement du signal et l'analyse de données temporelles. Les domaines d'application traités couvrent à la fois l'analyse de contenus et la perception par ordinateur (machine perception), notamment via des approches multimodales. Les exemples d'applications attaquées incluent l'audition par ordinateur (machine listening), l'analyse de contenus audiovisuels et musicaux, l’analyse et la reconnaissance des états socio-émotionnels, ainsi que l'analyse des signaux électroencéphalographiques (EEG). Slim Essid a été impliqué depuis 2005 dans plusieurs projets collaboratifs nationaux et européens (FP6 et FP7).

Mots-clés : apprentissage structuré, apprentissage multi-vues, analyse en variables latentes, apprentissage de représentations, données audio et multimodales.

Voir son site web

Olivier Fercoq

Olivier Fercoq

Maître de Conférences à Télécom Paris

Olivier Fercoq est titulaire d’un Master de Paris 6 et de l’ENSTA Paris. Pendant son doctorat à l'École polytechnique (2009-2012), il a étudié des problèmes d'optimisation liés au référencement des pages web et à des applications en biologie. Il a passé deux ans à l'Université d'Édimbourg où il a travaillé sur les méthodes de descente par coordonnée. Il a rejoint Télécom Paris en 2014. Ses intérêts de recherche actuels portent sur le développement et l'étude d'algorithmes d'optimisation pour des problèmes de grande dimension.

Mots-clés : optimisation, algorithmes stochastiques, vitesse de convergence, grande dimension, calculs en parallèle.

Voir son site web

Robert M. Gower

Robert M. Gower

Maître de Conférences à Télécom Paris

Robert M. Gower est Maître de conférence à Télécom Paris depuis 2017. Il s'intéresse à la conception et à l'analyse de nouveaux algorithmes stochastiques pour résoudre des problèmes de big data dans l'apprentissage automatique et l'informatique scientifique. Mathématicien de formation, ses études universitaires ont commencé avec un baccalauréat et une maîtrise en mathématiques appliquées à l'Université d'État de Campinas (Brésil), où il a conçu les algorithmes à l'état de l'art pour calculer automatiquement les dérivées d'ordre élevé en utilisant une back-propagation. Son doctorat en méthodes numériques stochastiques à l'Université d'Édimbourg lui a valu la 2e place du prix Leslie Fox 2017 en analyse numérique. En 2016, il obtient le fonds postdoctoral de la Fondation des Sciences Mathématiques de Paris pour continuer son travail en post-doctorat à l'ENS.

Mots-clés : Optimisation stochastique, algèbre linéaire numérique aléatoire, optimisation convexe, apprentissage automatique, différenciation automatique.

Voir son site web

Ekhine Irurozki

Ekhine Irurozki

Maître de conférences

C’est en 2014 qu’Ekhine Irurozki a obtenu son doctorat d’informatique auprès de l’Université du Pays basque en Espagne. Elle est maître de conférences à Télécom Paris depuis 2020. Avant de rejoindre Télécom Paris, elle a été postdoctorante dans le département Apprentissage Statistique du Basque Center for Applied Mathematics (BCAM) à Bilbao, de 2017 à 2020. Auparavant, elle a travaillé à l’Université du Pays basque en tant que postdoctorante, de 2015 à 2017. Ses recherches portent essentiellement sur les techniques d’aide à la décision fondées sur l’optimisation et l’intelligence artificielle et elle s’intéresse plus particulièrement aux problèmes de statistique mettant en jeu des données de classement.

Au BACM, Ekhine Irurozki a été responsable du laboratoire cybersécurité et membre de l'équipe de transfert, ayant déjà travaillé sur différents projets avec des sociétés issues de l’industrie et des services. L’Université du Pays basque lui a  octroyé le Grand Prix Doctoral.

Mots-clés : modèles de classement, permutations, combinatoire, modélisation de préférence, intelligence artificielle, optimisation

 
Ons Jelassi

Ons Jelassi

Enseignante et responsable de formation

Ons Jelassi est enseignante à la formation continue de Télécom Paris et de Télécom Evolution. Elle supervise les programmes des Mastères Spécialisés et des Certificats d’Etudes Spécialisées (CES) en science des données et intelligence artificielle. Elle a travaillé dans le domaine de la métrologie et des performances des réseaux dans le cadre de sa thèse et en tant que consultante auprès de grandes entreprises pour des missions d'audit et d'expertise. Ses travaux de recherche au sein de l’équipe de recherche S2A du LTCI portent sur le passage à l'échelle des algorithmes d'apprentissage.

Mots-clés : apprentissage, performances, passage à l'échelle, algorithmes distribués.
Matthieu Labeau

Matthieu Labeau

Maître de conférences

Matthieu Labeau a rejoint Télécom Paris en tant que Maître de conférences en 2019. Il a effectué son doctorat à l'Université Paris-Saclay et s'est intéressé aux problèmes posés par les grands vocabulaires en modélisation du langage. Il a ensuite été chercheur postdoctoral à l'Université d'Édimbourg. Ses domaines de recherche, au sein du traitement automatique du langage, concernent principalement l'apprentissage de représentations et la modélisation du langage.

Mots-clés: traitement automatique du langage naturel, modélisation du langage, représentations de mots, apprentissage profond

 
Laurence Likforman

Laurence Likforman

Maître de conférences (HDR)

Laurence Likforman est Maître de conférences (HDR) à Télécom Paris depuis 1991. Elle est responsable du cours de Reconnaissance des formes et enseigne également en Traitement du signal, Analyse de documents et Statistiques. Ses travaux de recherche portent notamment sur l’utilisation des réseaux de neurones récurrents et convolutifs pour la reconnaissance et l’analyse de l’écriture manuscrite.

Mots-Clés : reconnaissance d'écriture, modèles Markoviens, réseaux Bayesiens, réseaux de neurones récurrents

Voir son site

Geoffroy Peeters

Geoffroy Peeters

Professeur à Télécom Paris

Geoffroy Peeters travaille dans l’équipe LTCI S2A de Télécom Paris. Il a obtenu son doctorat en 2001 et son habilitation en 2013 à l’Université Paris VI pour ses travaux sur le traitement du signal audio, l’analyse des données et l’apprentissage statistique. Avant de rejoindre Télécom Paris, il était responsable des travaux de recherche concernant la récupération d’information musicale à l’IRCAM. Ses recherches actuelles portent sur le traitement de signal, l’apprentissage statistique et l’apprentissage profond (deep learning) appliqués à l’analyse des données audio et musicales.

Mots-clés : Traitement de signal audio, Apprentissage statistique, Apprentissage profond.

Voir son site

Gaël Richard

Gaël Richard

Professeur à Télécom Paris

Gaël Richard est responsable du département IDS (Image, Données, Signal). Ses travaux de recherche sont au cœur du numérique et dédiés à l’analyse, la transformation, la compréhension ou l’interprétation des signaux sonores (parole, musique, sons environnementaux…) et dans une moindre mesure des signaux multimédia. Il a notamment développé plusieurs méthodes pour la séparation des signaux musicaux et audio reposant sur des principes de factorisations de matrices non-négatives et d’apprentissage automatique (machine learning).

Mots-clés : Machine listening, Factorisation de matrices, Apprentissage de représentations, Music Information Retrieval (MIR), Reconnaissance sonore, Séparation de sources.

Voir son site

Fabian M. Suchanek

Fabian M. Suchanek

Professeur à Télécom Paris

Fabian M. Suchanek a développé entre autres YAGO, une des plus grandes bases de connaissances publiques, qui lui a valu une mention honorable dans le cadre du prix de thèse SIGMOD. Parmi ses domaines de recherche figurent la fouille de données, le raisonnement automatisé et les bases de connaissances. Fabian a publié environ 70 articles scientifiques dans diverses publications, notamment ISWC, VLDB, SIGMOD, WWW, CIKM, ICDE et SIGIR, et ses travaux ont été cités plus de 7000 fois.

Mots-clés : web sémantique, bases de connaissances, fouille de données, traitement automatique du langage naturel, raisonnement automatisé.

Voir son site

Doctorants financés par la chaire

Dimitri Bouche

Dimitri Bouche

Doctorant

Dimitri Bouche travaille sur une problématique peu explorée en machine learning  : l’apprentissage de processus spatio-temporels. Son étude portera sur l’analyse de données fonctionnelles et sur les méthodes à noyaux à valeurs opérateurs dans le but de résoudre plusieurs défis inhérents à ce type de données. Dimitri Bouche travaille en collaboration avec Florence d’Alché-Buc, la responsable de la chaire DSAIDIS et professeure à Télécom Paris, François Roueff, professeur à Télécom Paris et Marianne Clausel, professeure à l'Université de Lorraine.

Mots-clés: machine learning  : l’apprentissage de processus spatio-temporels, analyse de données fonctionnelles, méthodes à noyaux à valeurs opérateurs

Jayneel Parekh

Jayneel Parekh

Doctorant

Jayneel Parekh est doctorant à Télécom Paris depuis septembre 2019. Il y travaille sous la direction de Florence d’Alché-Buc et de Pavlo Mozharovskyi. Sa thèse porte sur les modèles d’apprentissage statistique interprétables « by design ». Il a obtenu ses diplômes de Bachelor et de Master à l’IIT de Bombay. Ses centres d’intérêt principaux sont l’apprentissage statistique, ainsi que ses applications dans les domaines audio/visuel.

Mots-clés: apprentissage statistique interprétable, deep learning, analyse audio-visuel

Emilia Siviero

Emilia Siviero

Doctorante

Emilia Siviero est doctorante en première année à Télécom Paris, sous la direction de Stephan Clémençon (Télécom Paris) et Emilie Chautru (Mines ParisTech). Son sujet de recherche porte sur les méthodes d'apprentissage statistique pour les données spatiales. Elle a obtenu un Master 2 de Mathématiques, Vision et Apprentissage (MVA) de l'ENS Paris-Saclay.

Mots-clés: apprentissage statistique, données spatiales, géostatistiques

Doctorants

Pierre  Colombo

Pierre Colombo

Doctorant
Pierre Colombo est doctorant en première année à Télécom Paris, Institut Polytechnique de Paris, sous la direction de Chloé Clavel (Télécom Paris), Giovanna Varni (Télécom Paris) et Emmanuel Vignon (IBM). Il s'intéresse aux différents domaines du langage naturel et tout particulièrement à la production de langage naturel. Il détient deux Mastères en informatique, l’un obtenu à Supélec en France et l’autre à l’EPFL en Suisse.
Hamid Jalalzai

Hamid Jalalzai

Doctorant
Hamid Jalalzai est doctorant à Telecom Paris dans l’équipe Signal, Statistique et Apprentissage (S2A) du LTCI sous la direction de Chloé Clavel, Anne Sabourin et Eric Gaussier. Ses travaux sont financés par la chaire de recherche industrielle Machine Learning for Big Data et par la chaire Data Science and Artificial Intelligence for Digitalized Industry and Services.  Avant de rejoindre Télécom Paris, il a obtenu un Mastère en science des données à l’Université Paris-Saclay (avec pour co-tutelles l’Ecole polytechnique, l’ENS Cachan, Télécom Paris et ENSAE Paris) et un Mastère de mathématiques appliquées et statistiques à l’INSA à Toulouse.
Robin Vogel

Robin Vogel

Doctorant

Robin Vogel est doctorant à Télécom Paris depuis 2017, sous la supervision de Stephan Clémençon, Aurélien Bellet (Inria) et Anne Sabourin. Il est employé par IDEMIA, société leader dans le domaine des solutions de biométrie et de sécurité, dans le cadre d'un accord CIFRE. Il s'intéresse à la théorie de l'apprentissage statistique et à l'apprentissage automatique pour l'identification et le contrôle d'accès. Il a obtenu son diplôme d'ingénieur de l'ENSAE Paris ainsi que le M2 Data Science de l'Université Paris-Saclay en 2016.

Mots-clés: apprentissage par similarité, classement, biométrie, théorie de l'apprentissage statistique, apprentissage profond.

Voir son site

Post-doctorants

Benoît Fuentes

Benoît Fuentes

Chercheur post-doctorant

Benoit Fuentes est chercheur post-doctorant au sein de l’équipe S2A du LTCI à Télécom Paris depuis mai 2020. Il travaille à l'élaboration d'un outil logiciel générique pour les factorisations profondes de tenseurs ainsi que sur la théorie probabiliste sous-jacente. Après avoir obtenu son doctorat en 2013 en analyse des signaux audio pour la transcription automatique de musique et la séparation de sources à Télécom Paris, il a travaillé 6 ans à développer des algorithmes de séparation de source de signaux électriques dans l'entreprise Smart Impulse, spécialisée dans les diagnostiques de consommations électrique en vue d'économies d'énergie.

Mots clés : traitement du signal, séparation de sources, factorisation de tenseurs, apprentissage non-supervisé, algorithmes d'inférence bayésienne.

Voir son site web

Yannick Guyonvarch

Yannick Guyonvarch

Chercheur postdoctoral

Yannick Guyonvarch est chercheur postdoctoral dans le labo LTCI au sein de l'équipe S2A. Il a obtenu son doctorat en économétrie auprès de l’ENSAE Paris. Son doctorat portait essentiellement sur l’inférence dans des problèmes de M-estimation avec des données échangeables. Il s’intéresse actuellement à des domaines de recherche tels que l'analyse non asymptotique des méthodes d’échantillonnage d’enquête et l'apprentissage par transfert.

Mots-clés : échantillonnage d’enquête, apprentissage par transfert, inférence non asymptotique, statistique non paramétrique.

Nathan Noiry

Nathan Noiry

Chercheur Post-doctorant
Nathan Noiry travaille en tant que chercheur postdoctoral dans l'équipe de recherche S2A (Signal, Statistics and Learning) du LTCI. Il s'intéresse à l’échantillonnage d’enquête, l’apprentissage par transfert et à la problématique de l‘apprentissage statistique au sens large. Après des études à l’Ecole normale supérieure de Lyon, il a obtenu un doctorat en théorie des probabilités, ses travaux portant sur les matrices aléatoires et les graphes aléatoires.

Mots-clés : apprentissage statistique, échantillonnage d’enquête, apprentissage par transfert, matrices aléatoires, graphes aléatoires.

Site web personnel

Sanjeel Parekh

Sanjeel Parekh

Chercheur post-doctorant

Sanjeel Parekh va se consacrer à l'apprentissage actif. Il sera encadré par la professeure Florence d'Alché-Buc. Sanjeel a occupé un poste d’ingénieur de recherche postdoctoral et s’est intéressé à la détection d’événements sonores en temps réel pour le compte d’un projet de startup à Télécom Paris. De 2016 à 2019 ses travaux l’ont aidé à préparer sa thèse sur l'analyse de scène visuelle et sonore au sein de Technicolor R&D et Télécom Paris. Auparavant, il a obtenu en 2015 un Master (MS) en informatique des sons et de la musique à l’Université Pompeu Fabra (UPF) en Espagne, et un Bachelor (B. Tech hons.) en électronique et ingénierie des communications au LNM Institute of Information Technology, en Inde en 2014. Ses travaux portent sur le développement et l'application de techniques d'apprentissage liées à des problèmes issus du domaine audiovisuel.

Mots-clés: Apprentissage de représentation, apprentissage profond, apprentissage actif, analyse audiovisuelle

Voir son site web

Stagiaires

Tamim El Ahmad

Tamim El Ahmad

Stagiaire
Tamim El Ahmad est élève au master 2 Mathématique, Vision, Apprentissage (MVA) de l'ENS Paris-Saclay, master de mathématiques spécialisé en apprentissage automatique et en vision par ordinateur. Il est un ancien élève en master 1 de Mathématiques appliquées à Paris-Diderot et en cycle d'ingénieur aux Mines Saint-Etienne. Il intégrera l'équipe du 27/04/2020 au 30/09/2020 pour effectuer le stage intitulé : « Le meilleur des deux mondes: apprentissage de réseaux profonds à noyaux » encadré par Florence d'Alché-Buc, professeure à Télécom Paris et titulaire de la chaire DSAIDIS. Pendant son stage, il s'intéressera au développement d'architectures hybrides mêlant réseaux de neurones et modèles à noyaux pour résoudre des problèmes de prédiction de données structurées (notamment prédiction de liens, prédiction de séquences et de graphes)

Mots-clés: apprentissage profond, méthodes à noyaux, prédiction de données structurées, structure hybride

Alumni

Asma Atamna

Asma Atamna

Chercheuse post-doctorante (2019-2020)
Asma Atamna est chercheuse post-doctorante au sein de l’équipe S2A du LTCI à Télécom Paris depuis septembre 2019. Ses travaux portent sur des problématiques d'apprentissage profond qui lui permettent d'analyser les signaux multimodaux dans un contexte d’interaction homme-machine. Elle a obtenu son doctorat, dont le sujet était l’optimisation continue boîte noire, à l’Université Paris-Saclay en 2017 avant de rejoindre le Centre de Mathématiques Appliquées de l’Ecole Polytechnique (CMAP) en tant que chercheuse post-doctorante. Asma Ataman a également été chercheuse post-doctorante à l’Institut de Chimie et des Matériaux Paris-Est du CNRS. Elle s’est intéressée à la production d’hydrures métalliques servant au stockage d’hydrogène grâce à une approche d'apprentissage statistique.

Keywords: Apprentissage profond, réseaux de neurones récurrents, interaction homme-machine, reconnaissance émotionnelle, détection de baisse d’engagement de l’utilisateur

Site Internet
Jean-Rémy Conti

Jean-Rémy Conti

Stagiaire (2019)

Jean-Rémy Conti s’intéressera aux méthodes d’apprentissage statistique pour les données spatiales. Il y définira un cadre mathématique permettant d’établir la capacité de généralisation des règles obtenues par minimisation du risque empirique ainsi qu’à étudier d’autres extensions au contexte spatial d’algorithmes populaires d’un point de vue théorique et expérimental à la fois. Il est encadré par Stéphan Clémençon, professeur à Télécom Paris et Emilie Chautru, co-directrice de la formation de géostatistique et chargée de recherche au centre de Géostatistique des Mines de Paris.

Mots-clés: apprentissage statistique pour les donnés spatiales, mathématique, spatial d'algorithmes, géostatistique

Halim Hizaoui

Halim Hizaoui

Stagiaire (2020)

Halim Hizaoui est élève-ingénieur en intelligence artificielle à l'ENSTA Paris au sein d’un parcours menant à l’obtention d’un double diplôme ENSTA-ENIT (Ecole nationale d'ingénieurs de Tunis). Il est passionné par la finance et le machine learning.

Pendant son stage intitulé "Apprentissage multiéchelle à noyau avec la méthode Alpha-procedure.", il développera une méthode de classification supervisée inspirée du classifieur DDalpha (R-package ddalpha). Le classifieur DDalpha se base sur le Data Depth et l’Alpha-procedure. Il a l’avantage d’être non paramétrique, rapide et robuste. L’alpha-procedure est une heuristique itérative qui permet d’obtenir un espace fini de variables pertinentes. Grâce à cette nature récursive, l’optimisation de la fonction loss se fait en un temps de calculs réduit.  La combinaison Data Depth et Alpha-procedure donne des résultats prometteurs qui encouragent à développer davantage cette méthode côté heuristique. Le stage sera donc consacré à poursuivre les recherches sur l’Alpha-procedure. Des bases de données réelles et synthétiques seront testées en vue de déterminer les paramètres optimaux selon chaque configuration et de fournir une aide à la décision pour le choix de ces paramètres. Il sera encadré par Pavlo Mozharovskyi, maître de conférences à Télécom Paris.

Mots clés : IA, Statistiques, Machine Learning, RKHS, Classification.
Orson Jay

Orson Jay

Stagiaire (2020)

Orson Jay est étudiant à l'Ecole Centrale de Nantes en master 1 Statistiques et Science des données. Son stage, qui se déroule du 01/04/2020 au 28/08/2020, s'intitule : « Prédiction multi-labels de compétences sociales dans des vidéos d’entretiens d’embauche par des réseaux de neurones récurrents ». Au cours de celui-ci, Orson est amené à étudier les compétences générales recherchées aux entretiens d’embauche différés par une méthode d’analyse de corpus, à étudier la littérature récente sur les modèles multi-labels et les méthodes de représentation de labels ainsi qu'à implémenter des réseaux de neurones récurrents basés sur des unités LSTM ou GRU pour la résolution de problème de multi-labels. Ce stage est encadré par Chloé Clavel, enseignante et chercheuse à Télécom Paris et Léo Hemamou, doctorant à Télécom Paris.

Mots-clés : traitement automatique du langage naturel, apprentissage profond, modèles multi-labels.

Cliquez ici pour voir l'offre de stage
Pierre Laforgue

Pierre Laforgue

Doctorant (2016-2020)

Pierre Laforgue est doctorant au sein de l'équipe S²A de Télécom Paris depuis le 10 octobre 2016. Diplômé de l'ENSAE Paris, il est également titulaire du Master 2 "Mathématiques, Apprentissage et Sciences Humaines" de l'Université Paris Dauphine. Sa thèse, encadrée par Florence d'Alché-Buc et Stephan Clémençon, porte sur l'apprentissage non-supervisé de représentations, avec pour objectif de l'appliquer aux séries temporelles.

Mots-clés : apprentissage non supervisé, apprentissage de la représentation, séries temporelles.

Rémi Leluc

Rémi Leluc

Stagiaire (2019)

Le stage de Rémi Leluc portera sur l’étude des méthodes de Monte-Carlo adaptatives dans le cadre de l’apprentissage par renforcement d’un point de vue théorique (convergence et inégalités, bornes théoriques) et d’un point de vue pratique (implémentation de nouvelles méthodes et comparaisons avec les méthodes de l’état de l’art). Il est supervisé par François Portier, maître de conférence à Télécom Paris et Pascal Bianchi professeur à Télécom Paris.

Mots-clés: apprentissage par renforcement d’un point de vue théorique, convergence et inégalités, bornes théoriques, méthodes de l’état de l’art

Brice Parilusyan

Brice Parilusyan

Stagiaire (2019)

Brice Parilusyan est un passionné de robotique. Il intègre l’association robotique de son école où il a participé deux fois à la coupe de France de robotique et construit InMoov, un robot humanoïde à taille humaine. Son sujet de stage portera sur l’étude des signaux sociaux dans un groupe. Il travaille à l’étude « d’état émergeant » dans un groupe, comme la cohésion ou le leadership et la manière dont un agent virtuel peut le quantifier. Il est encadré par Giovanna Varni, Maître de conférences à Télécom Paris.

Mots-clés: robotique, signaux sociaux, virtuel
Oskar Rynkiewicz

Oskar Rynkiewicz

Stagiaire (2020)

Oskar Rynkiewicz est étudiant au master Intelligence Artificielle, Systèmes, Données (IASD) à l'université Paris Dauphine-PSL. Il s'intéresse à l'optimisation et l'apprentissage automatique.  A Télécom Paris, il intègre l'équipe S²A du 30/03/2020 au 30/09/2020 pour effectuer son stage de recherche sous l'encadrement d'Olivier Fercoq, maître de conférences à Télécom Paris. Il cherche à obtenir une borne inférieure d'algorithmes primal-dual sur les problèmes d'optimisation convexes à contraintes affines sous l’hypothèse de sous-régularité métrique. Une fois obtenue, la borne inférieure vérifiera l'optimalité des méthodes actuellement utilisées en ce qui concerne la sous-régularité métrique.

Mots-clés : optimisation convexe, borne inférieure, vitesse de convergence, sous-régularité métrique, apprentissage automatique.

Othmane Sebbouh

Othmane Sebbouh

Stagiaire (2019)

Othmane Sebbouh est étudiant en Master Data Science à l'ENSAE et à l'Ecole polytechnique. Le sujet de son stage au sein de la chaire DSAIDIS est "Combler le fossé entre la théorie et la pratique pour les méthodes à réduction de variance stochastique". SVRG (stochastic variance reduced method) est un algorithme en deux boucles, une boucle externe et une boucle interne : un gradient complet (calculé sur l’ensemble des données) de référence est évalué dans la boucle externe, après quoi m étapes d'une boucle interne sont exécutées, où le gradient de référence est utilisé pour créer une estimation moins coûteuse du gradient actuel avec réduction de variance. La simplicité de la méthode SVRG et de son analyse a conduit à de multiples extensions et variantes pour l’optimisation convexe et non convexe. Cependant, il existe un écart important entre les paramètres suggérés par l'analyse et ce qui est utilisé en pratique. C'est pourquoi le travail d'Othmane consistera à développer des pistes pour combler cet écart.

Umut Şimşekli

Umut Şimşekli

Maître de conférences à Télécom Paris (2016-2020)

Umut Şimşekli a obtenu son doctorat en 2015 suite à ses travaux sur les méthodes d’inférence pour les modèles de factorisation matricielle et tensorielle à très grande échelle dans le département génie informatique de l’Université Bogaziçi, à Istanboul (Turquie). Ses domaines de recherche sont l’apprentissage statistique bayésien à l’échelle, le traitement du signal audio et musical et les systèmes de recommandation.

Mots-clés : Factorisations matricielle et tensorielle, Chaînes de Markov Monte Carlo, Traitement du signal audio et musical.

Voir son site

Yousef Taheri Sojasi

Yousef Taheri Sojasi

Stagiaire (2020)

Yousef Taheri Sojasi est un passionné d'apprentissage statistique et  de traitement du langage naturel. Son stage intitulé « Signaux faibles sur des données textuelles » est encadré par Stephan Clémençon, professeur à Télécom Paris et  Matthieu Labeau, maître de conférences à Télécom Paris. Ce stage, qui a débuté le 30/03/2020 et qui s'achèvera le 31/08/2020, porte sur le développement de  méthodes  de représentation visant à faciliter la  détection de signaux faibles sur des données textuelles. La détection  de signaux faibles est un enjeu majeur sur  le  plan  applicatif. La méthode est inspirée par approches et critères fondés sur la théorie des  valeurs  extrêmes  ayant  permis  d’étendre les techniques d’apprentissage supervisé ou non supervisé.

Mots-clés: traitement automatique du langage naturel, représentations  de mots, théorie  des  valeurs extrêmes, apprentissage supervisé,  apprentissage non supervisé

Junjie Yang

Junjie Yang

Stagiaire (2020)
Junjie Yang est élève en deuxième année de master à l'École d’Ingénieurs ParisTech Shanghai Jiao Tong (SJTU-ParisTech). Il y a effectué  des recherches sur le traitement automatique du langage, en particulier autour de « Question Answering » et « Natural Language Understanding » via l’apprentissage statistique. 
Il  intégrera la chaire du 18/05/2020 au 17/11/2020 pour effectuer son stage intitulé : « Représentations de sortie pour la prédiction structurée de texte » sous l'encadrement de Matthieu Labeau, maître de conférence à Télécom Paris et Florence d’Alché-Buc, professeure à Télécom Paris et titulaire de la chaire DSAIDIS. La visée de ce stage est l’application de plusieurs familles de méthodes de la prédiction de sortie structurée aux données textuelles, et notamment à la génération de texte qui comprend un nombre important de tâches potentiellement très différentes (Abstractive Summarization, Question Answering, Automatic Image Description, Machine Translation…).

Mots-clés: traitement automatique du langage naturel, prédiction de sortie structurée, génération de texte, apprentissage profond