ICASSP est une conférence internationale sur l’acoustique, la parole et le traitement du signal. Elle est organisée chaque année par l’Institut des ingénieurs électriciens et électroniciens (IEEE). Réunissant des orateurs de renommée internationale, la session 2020 aura lieu à Barcelone du 4 au 8 mai 2020 et comptabilisera plus de 3000 participants. Ces derniers pourront assister à des tutoriels, ateliers et expositions. En outre, l’événement constituera une excellente opportunité de nouer des contacts avec des professionnels du monde entier.

Pour y apporter leurs contributions, les chercheurs et doctorants de la chaire DSAIDIS de Télécom Paris ont proposé des articles. Au cours de la conférence, ils présenteront les travaux suivant :

Approximate Bayesian Computation with the Sliced-Wasserstein Distance
Kimia Nadjahi, Valentin De Bortoli, Alain Durmus, Roland Badeau, Umut Şimşekli

Kimia Nadjahi, doctorante d’Umut Şimşekli, a reçu le 5 mai le prix du meilleur article étudiant ICASSP 2020 pour son article.

 

Laplace state space filter with exact inference and moment matching
Julian Neri, Philippe Depalle, Roland Badeau

Probabilistic filter and smoother for variational inference of bayesian linear dynamical systems
Julian Neri, Roland Badeau, Philippe Depalle

Joint phoneme alignment and text-informed speech separation on highly corrupted speech
Kilian Schulze-Forster, Clement S. J. Doire, Gaël Richard, Roland Badeau

Speech intelligibility enhancement by equalization for in-car applications
Enguerrand Gentet, Bertrand David, Sébastien Denjean, Gaël Richard, Vincent Roussarie

Neutral to lombard speech conversion with deep learning
Enguerrand Gentet, Bertrand David, Sébastien Denjean, Gaël Richard, Vincent Roussarie

Learning to rank music tracks using triplet loss
Laure Prétet, Gaël Richard, Geoffroy Peeters

Audio-based detection of explicit content in music
Andrea Vaglio, Romain Hennequin, Manuel Moussallam, Gaël Richard, Florence d’Alché-Buc

Audio-based auto-tagging with contextual tags for music
Karim M. Ibrahim, Jimena Royo-Letelier, Elena Epure, Geoffroy Peeters, Gaël Richard

Speech-to-singing conversion in an encoder-decoder framework
Jayneel Parekh, Preeti Rao, Yi-Hsuan Yang

How confident are you? Exploring the role of fillers in the automatic prediction of a speaker’s confidence
Tanvi Dinkar, Ioana Vasilescu, Catherine Pelachaud, Chloé Clavel