Actualités > Soutenance de thèse de Monsieur Pierre MAHÉ
Monsieur Pierre MAHÉ présentera ses travaux intitulés :
« Codage Ambisonique pour les Communications immersives »
Spécialité : informatique et applications
Le 3 février 2022 à 14h00
Lieu : I.U.T.
15 rue F. de Vaux de Foletier
Amphithéâtre G
17000 LA ROCHELLE
Composition du jury :
M. BADEAU Roland, Professeur, Télécom Paris
Mme DESAINTE-CATHERINE Myriam, Professeure, Bordeaux INP
M. GIRIN Laurent, Professeur, Grenoble INP
M. LAGRANGE Mathieu, Chargé de recherche, HDR, Centrale Nantes
M. MARCHAND Sylvain, Professeur, La Rochelle Université
M. RAGOT Stéphane, Ingénieur de recherche, Orange labs Lannion
M. RICHARD Gaël, Professeur, Télécom Paris
Résumé :
Cette thèse s’inscrit dans le contexte de l’essor des contenus immersifs. Depuis quelques années, les technologies de captation et de restitution sonore immersif se sont développées de manière im- portante. Ce contenu a fait naître le besoin de créer de nouvelles méthodes dédiées à la compression audio spatialisé, notamment dans le domaine de la téléphonie et des services conversationnels. Il existe plusieurs manières de représenter l’audio spatialisé, dans cette thèse nous sommes intéressés à l’ambisonie d’ordre 1. Dans un premier temps, nos travaux ont porté sur la recherche d’une solution pour améliorer le codage multimono. Cette solution a été de développer un traitement en amont du codec multimono pour décorréler les signaux des composantes ambisoniques. Une attention particulière a été portée à la garantie de continuité du signal entre les trames et à la quantification des métadonnées spatiales. Dans un second temps, nous avons étudié comment utiliser la connaissance de la répartition de l’énergie du signal dans l’espace, aussi appelée image spatiale, pour créer de nouvelles méthodes de codage. L’utilisation de cette image spatiale a permis d’élaborer deux méthodes de compression. La première approche proposée est basée sur la correction spatiale du signal décodé. Cette correction se base sur la différence entre les images spatiales du signal d’origine et du signal décodés pour atténuer les altérations spatiales. Ce principe a été étendu dans une seconde approche à une méthode de codage paramétrique. Dans une dernière partie de cette thèse, plus exploratoire, nous avons étudié une approche de compression par réseaux de neurones en nous inspirant de modèle de compression d’images par auto-encodeur variationnel.
https://www.univ-larochelle.fr/recherche/doctorat-et-hdr/doctorat/soutenances-de-theses/