Année universitaire 2011-2012

PROPOSITION DE STAGE M2

Laboratoire d'accueil : LAM-IJLRA (Lutherie-Acoustique-Musique), UPMC

Responsable du stage : Boris DOVAL, tél. : 01 53 95 43 32, courriel : boris.doval(at)upmc.fr
Encadrement : Cédrik ERBSEN, tél : 01 53 95 43 26, courriel : cedrik.erbsen (at) gmail.com

Titre : Estimation de source par analyse-par-la-synthèse in vivo

Résumé :

Depuis plus d’un demi-siècle, la production vocale humaine est modélisée par la théorie Source-Filtre. Lors de la production de sons voisés, le mouvement vibratoire des cordes vocales génère une source de débit acoustique, qui charge le conduit vocal. Celui-ci se comporte comme un résonateur acoustique, caractérisé par sa fonction de transfert. L’onde acoustique ainsi filtrée est ensuite rayonnée par les lèvres vers le milieu extérieur. Une hypothèse très forte de cette théorie est l’absence d’interaction entre la source glottique et le filtre du conduit vocal. Des études récentes montrent pourtant l’importance de prendre en compte ces interactions pour l’étude de la voix chantée et la synthèse de qualité vocale. L’étude de ces interactions est rendue délicate par le fait que l’instrument vocal fait partie intégrante de l’humain.

L’objectif du stage est de confronter la théorie source-filtre non-interactive avec la réalité de la production vocale humaine. L'approche envisagée ici consiste à injecter une source acoustique calibrée dans le conduit vocal d'un chanteur et à enregistrer la réponse à cette charge acoustique par un microphone extérieur placé en sortie des lèvres. À partir de la comparaison entre un signal acoustique naturel (une production chantée) et celui obtenu par injection d'une source synthétique soigneusement calibrée, les caractéristiques de la source naturelle seront estimées. Il s'agit donc d'une procédure d'analyse-par-la-synthèse de la source vocale. Les comparaisons entre signal acoustique naturel et signal synthétique permettront aussi d’approcher les limites des possibilités d’un modèle source-filtre non-interactif.

Des dispositifs d'injection de source seront disponibles et calibrés au début du stage. La première partie du stage consistera à effectuer des enregistrements avec le dispositif et à les comparer avec les productions vocales naturelles correspondantes. La deuxième partie consistera à étudier les caractéristiques des sources estimées au regard des modèles actuellement utilisés.

Outils utilisés : Matlab

Compétences souhaitées : Matlab ; notions sur la production et l’acoustique de la voix ; traitement du signal.

Mots clés : voix chantée ; traitement du signal.

Durée du stage : 5 mois (mars-Juillet)