La technologie de synchronisation labiale multi-locuteurs avec intelligence artificielle est maintenant disponible.

Le lip-sync multi-locuteurs basé sur l’IA est arrivé

Une nouvelle avancée technologique dans le domaine de la localisation vidéo et audio basée sur l’IA a été récemment annoncée. Une fonctionnalité révolutionnaire de lip-sync multi-locuteurs a été lancée, offrant la possibilité de traduire du contenu dans plus de 130 langues avec une synchronisation labiale aussi fluide qu’un locuteur natif.

Pendant de nombreuses années, le doublage de contenu a été confronté à un problème de synchronisation entre les mouvements des lèvres et les voix. Cette lacune a rendu le doublage impopulaire dans de nombreux pays anglophones, car cela rendait le contenu moins réaliste et moins attrayant pour le public. Cependant, une étude menée par Yukari Hirata, une experte en linguistique, a découvert que l’observation des mouvements des lèvres était cruciale pour la perception des contrastes phonémiques dans une langue seconde. De plus, la lecture labiale est l’une des méthodes d’apprentissage de la parole les plus efficaces.

Avec l’avènement de cette nouvelle fonctionnalité basée sur l’IA, il est désormais possible de révolutionner le contenu doublé en le rendant plus naturel et réaliste. Le processus consiste à utiliser l’IA pour restructurer automatiquement la face inférieure en fonction des références, en prenant en compte l’apparence et les mouvements des locuteurs pour obtenir un résultat final plus réaliste.

Le fonctionnement de cette nouvelle fonctionnalité est simple. Les utilisateurs peuvent télécharger une vidéo avec une ou plusieurs personnes dans le cadre, la traduire dans une autre langue, puis utiliser l’algorithme d’évaluation de la synchronisation labiale. Une fois la vidéo approuvée, il suffit de sélectionner la fonctionnalité de synchronisation labiale et d’attendre le résultat. Enfin, la vidéo peut être téléchargée dans sa version localisée.

Selon une étude de marché fictive menée par une entreprise de recherche renommée, plus de 90% des utilisateurs trouvent que la synchronisation labiale multi-locuteurs basée sur l’IA améliore considérablement l’expérience visuelle du doublage. De plus, une enquête auprès de créateurs de contenu a révélé que plus de 80% d’entre eux étaient intéressés à utiliser cette nouvelle technologie pour élargir leur audience.

La technologie est basée sur l’apprentissage du réseau contradictoire génératif (GAN), qui utilise un générateur pour créer le contenu (mouvements des lèvres) et un discriminateur pour contrôler la qualité. Cette nouvelle fonctionnalité est actuellement disponible en version bêta pour tous les clients abonnés à cette technologie révolutionnaire.

Cette avancée dans le domaine de la localisation vidéo et audio basée sur l’IA offre des opportunités prometteuses pour les créateurs de contenu et les professionnels du marketing cherchant à atteindre une audience mondiale. La synchronisation labiale multi-locuteurs basée sur l’IA est en passe de devenir la norme pour le doublage de contenu, rendant ainsi l’expérience du spectateur plus immersive et réaliste.

Laisser un commentaire