Anonymisation vocale

L’anonymisation vocale de Vuisio est un travail de traitement du signal intégré au cœur libre (le module anonymizer, sous licence AGPL). Côté usage, elle est décrite dans Fonctionnalités ; voici l’angle recherche.

L’enjeu (état de l’art)

La voix porte l’identité de celui qui parle. L’anonymiser tout en gardant la parole intelligible est un problème connu du traitement du signal ; la méthode McAdams (déformation des pôles spectraux du conduit vocal) est une technique de référence pour l’anonymisation du locuteur.

Le verrou technique

L’appliquer en temps réel, sur le flux audio en direct, à l’intérieur du serveur et sans service tiers, avec une latence acceptable et une voix qui reste compréhensible.

La démarche

Une déformation spectrale de type McAdams : analyse par transformée de Fourier, puis redimensionnement du conduit vocal du locuteur.
Un pipeline audio qui décode le flux Opus du participant, lui applique la déformation, puis le ré-encode en Opus (le codec reste le même). Seul l’audio du participant qui l’active est concerné.
Un branchement par le hook générique on_media_transform du SFU, appelé une fois par paquet source avant la retransmission (voir Les hooks).
Une activation à la demande par le participant, avec deux intensités, et la possibilité pour un modérateur de la forcer.

Les résultats

Une anonymisation vocale temps réel, fonctionnelle, entièrement dans le cœur libre et sur votre serveur, sans dépendre d’aucun service externe. C’est une brique utile pour les contextes sensibles (témoignages, consultations) et un exemple concret de ce que permet le système de hooks du SFU.