L’acteur britannique Stephen Fry tire la sonnette d’alarme sur les dangers potentiels du clonage vocal à l’aide de l’intelligence artificielle (IA). Cette mise en garde fait suite à la découverte que des personnes utilisaient cette technologie pour reproduire sa voix et l’utiliser dans un documentaire, à son insu et sans son consentement.
L’utilisation de l’IA pour cloner des voix humaines est une avancée inquiétante. Ces outils permettent désormais de reproduire rapidement et à moindre coût la voix d’une personne donnée. Bien que ces versions générées par l’IA ne soient pas encore parfaites, il est crucial de prendre conscience de la menace émergente qu’elles représentent. Cette technologie d’IA a le potentiel d’améliorer la narration dans le monde du cinéma, de l’animation et dans de nombreux autres domaines. Cependant, pour l’instant, elle est principalement utilisée à des fins malveillantes.
Lors du festival technologique CogX à Londres en septembre, Stephen Fry a diffusé un extrait d’un documentaire dans lequel il était le narrateur, mais il s’est avéré que sa voix avait été clonée numériquement. « Je n’ai rien dit de tout cela. C’était une machine. Oui, ça m’a choqué », a-t-il déclaré. La voix numérique a été créée à partir de sept livres audio Harry Potter, dont Stephen Fry avait narré la version originale. Ce clonage vocal soulève la question de la propriété de notre voix et pose des problèmes de sécurité et d’éthique.
Selon Stephen Fry, cette technologie d’IA est si avancée qu’il est impossible de faire la différence entre sa voix réelle et celle générée par l’IA. Même la prononciation de mots allemands ou de noms de lieux néerlandais est parfaite. Cette révélation a choqué les agents de l’acteur qui n’étaient pas au courant d’une telle technologie. Le fait que la voix d’un acteur puisse être copiée sans son consentement est particulièrement problématique compte tenu de la grève des écrivains qui vient de se terminer en septembre.
Le clonage vocal par IA nécessite un ensemble complet de données pour obtenir un résultat précis. Cependant, la quantité de données requise pour la voix est relativement faible, car chaque langue utilise un nombre restreint de sons. Une fois le système d’IA alimenté avec ces informations, il peut reconstruire n’importe quel mot en accédant aux enregistrements et en combinant les sons appropriés. Ce processus est simple, rapide et certaines entreprises le proposent gratuitement. Des entreprises comme ElevenLabs, Speechify et Resemble.ai développent et commercialisent cette technologie de clonage vocal.
Bien que l’utilisation de voix générées par IA présente des avantages indéniables, elle soulève également des inquiétudes. La responsabilité et le consentement sont des questions fondamentales, car les voix peuvent être programmées pour dire n’importe quoi. Ce problème est au centre des négociations entre les maisons de production et les acteurs, car ces derniers exigent des contrôles plus stricts sur la manière dont les voix sont utilisées. De plus, l’utilisation abusive de clones vocaux IA dans des activités criminelles est préoccupante. Les fraudeurs peuvent utiliser des voix clonées IA de personnes de confiance pour augmenter leurs chances de succès lors d’arnaques.
Les fournisseurs d’outils de clonage vocal précisent que leurs services ne doivent pas être utilisés à des fins malveillantes ou sans consentement. Cependant, il est difficile de faire respecter cette règle. Il est donc impératif de mettre en place une réglementation claire concernant le clonage vocal par IA afin de protéger la propriété de notre voix et de prévenir les utilisations abusives. La technologie évolue rapidement, et il est essentiel de prendre conscience des implications de ces avancées technologiques pour maintenir notre sécurité et notre éthique.