VoiceBox est le dernier modèle de génération text-to-speech (TTS) présenté par Meta. Sa promesse ? Révolutionner le domaine de la voix synthétique par l’IA grâce à l’apprentissage contextuel.
Si j étais une société tech sans scrupule, et si par exemple je disposais une armada de zombies qui utilisent mon réseau social et mon application de messagerie instantané , j aurais mis tout le monde sur écoute et j aurais entraîné mon IA en espionnant les conversations des gens !
Le speech serait tellement naturel et moins formel !
Pour moi l idée d entraîner l ia sur des livres audio n’est pas mauvaise , elle ne sera juste pas si naturelle . Ce sera comme si tu discutais avec un snob ou un comédien de théâtre
Un concurrent sérieux à Vall-E de microsoft ? ça en a l’air.
J’attends de l’entendre en vrai, car aucune démo sur leur site, juste 2 ou 3 clips qui ont pu être complètement retouchés. D’habitude Meta publie ses modèles sur Hugginface pour pouvoir les tester, et là, non. Bizarre ?
Finalement le Zuck n’avait pas mis tous ses oeufs dans le métaverse… pas mal de choses intéressantes de Meta en IA récemment