Avec son nouveau modèle d’IA, Microsoft est sur le point de transformer la synthèse vocale en offrant une qualité jamais vue jusqu’à présent. Pour preuve, cette technologie est capable de cloner une voix à la perfection.
l’utilisateur doit obtenir le consentement explicite de la personne dont la voix est utilisée, déclarer l’usage de contenus synthétiques et s’abstenir de toute tentative d’imitation ou de tromperie.
Ouf! Avec de telles mesures de sécurité, je me sens totalement rassuré…
À cause des usages à des finalités illégales (usurpation d’identité et propagation de fausses informations), chaque message vocal réel nécessitera d’être signé numériquement pour vérifier son authenticité. Quel cauchemar.
Je suis sûr qu’une oreille avertie pourrait quand même faire la différence même avec un accent et la prosodie reproduite à la perfection. C’est parce que quand on parle, on emploie aussi des expressions singulières propres à chacun selon le contexte : des petits parasites linguistiques comme des « heu », des « tu vois ? », « y a pas de souci », "‹ fin ›. Les français aiment bien commencer des phrases par « 'fin » pour dire « Enfin » pour nuancer leur propos. etc…Il y a plein petits exemples de la vie de tous les jours que l’IA ne pourrait pas inventer. Il y a aussi la connaissance des institutions et des termes employés pour désigner des structures, des établissements, des lieux.
Ne t’inquiète pas ça viendra, ce n’est que le début
On couple ça à Claude ou mistral, je me met en télétravail et les 2 font les réunions à m à place, même en teams
sur teams interpreteur on a déjà la fonction de clonage de voix, qui est franchement bluffant.