Commentaires : Alibaba dévoile une IA capable de vous faire parler et chanter à partir d’une simple photo

On arrête plus l’IA. Le groupe chinois Alibaba a présenté récemment son nouveau modèle d’intelligence artificielle surnommé « EMO ». Ce dernier permet d’animer une photo avec un réalisme saisissant.

heu, pas comme si ça existait depuis 10 ans, on appelait ça des filtres à l’époque…

" En utilisant un algorithme qui retranscrit directement l’audio reçu d’une part en mouvement faciale de l’autre part et « sans avoir recours à des modèles 3D intermédiaires ou à des points de repère faciaux »"

Et c’est donc là que se trouve le tour de force. Wombo.ai et consorts ont du soucis à se faire.
Par contre, aucunes notes sur la disponibilité ou sur l’utilisation de cet outils :slightly_frowning_face: ?

1 « J'aime »

Bluffant…
Il y a 30 ans Internet était surnommé « l’autoroute de l’information ».
Dorénavant c’est devenu « l’ autoroute de la désinformation »

5 « J'aime »

La fin du Monde est proche…

On savait que ce genre de chose allait arriver.
Il y avait déjà quelques vidéos « prometteuses » dans le genre.
Là, on va verser rapidement dans le systématique.
C’est extrêmement inquiétant, même dans la vie courante, quel est l’intérêt « utile » de ce genre de chose, à part faire circuler de fausses informations ? Concrètement à quoi cela peut-il servir, à part pour quelques biopics cinématographiques ?
Il est largement temps de légiférer, même si c’est illusoire…

1 « J'aime »

ça va en faire chanter plus d’un…

2 « J'aime »

Deepfake puissance 100… la seule limite sera notre imagination…

Je suis Sony, Universale, ou Warner Bros, je te garantie de l’intérêt de cette techno. Une prise qui a foiré, un acteur qui est défoncé 24/7 sur le tournage, je peux quand même reprendre une prise, ou finir un film (type Fast & Furious) avec un acteur décédé.

Et si j’ai les bons lobbys, je peux même faire en sorte que ce ne soit pas illégal d’inclure cela dans mes contrats et d’abuser de la technologie pour faire une seule prise à un figurant/auditionneur et le faire jouer pendant 2h dans un film.

Finalement on va peut être arriver à un virage ou l’information visuelle n’aura plus aucune crédibilité, du coup c’est tout un système à revoir (vidéo surveillance, authentification faciale, preuve par l’image ou l’audio…) mais après si on sait que c’est si simple et que ça ne vaut plus rien, peut être ça évitera justement l’utilisation de fausses videos vu que ça n’aura plus aucune valeur aux yeux de personnes…
Bon ok il y a du chemin à parcourir !

2 « J'aime »

ça confirme bien mes propos.
Seul les productions télévisées ou cinématographiques peuvent y trouver un intérêt, sain ou pas…
Au delà de ça, tout autre usage est forcément problématique ou suspect.

Sans compter les usages « anodins » mais destructeurs dans la société civile.
Adolescents malsains qui « règlent leurs comptes », licenciements abusifs ou calculés, mise en cause d’innocents, etc. La liste sera sans fin.

Au final le célèbre adage de Saint Thomas n’a plus lieu d’être :dizzy_face: ? A moins d’utiliser la bonne formule qui aurait dû être être " Je ne crois que ce que je touche ! " … en plongeant sa main sale dans la plaie béante et sanguinolente du Christ … le sadique :sweat_smile: .

Sinon, rétropédalage total et retour à la TSF et au canard acheté au tabac-presse du coin de la rue.

On est pas sorti de l’auberge :roll_eyes: .

Certes mais le risque est-il si important ?
Quand le potentiel est de faire chanter de la J-pop à Bob l’éponge.

Je lui trouve un petit air bridé à Mona Lisa. Ah on me dit dans l’oreillette qu’elle fredonne en cantonais…

Cette adage était déjà pas viable à ça création.

C’est juste totalement l’inverse.
Un filtre c’est appliquer une image fixe sur une image en mouvement en la collant comme on peut pour obtenir un résultat dégueulasse juste bon à faire marrer les gamines de 10 ans.
Là on transforme une image fixe en 3D visiblement puisque ce n’est pas juste un applat vu que les cheveux et autres détails bougent indépendamment du reste de l’image et on la rend vivante en la contrôlant par une vidéo.

finalement face à l’intelligence artificielle, la seule réponse est l’intelligence réelle : ne pas croire bêtement une image, une video, un article, un influenceur, un politicien, un imam, … et rechercher systématiquement le débat contradictoire.

C’est vrai, ça va à l’encontre de l’air du temps où on veut tout, tout de suite, et pas le temps, pas envie de chercher si ce qu’on me présente est vrai ou pas.

2 « J'aime »

Excellent ! ( ou pas )

Est-ce qu’on pourra aussi faire chanter une image de Xi Jinping sur du Winnie l’ourson en Chine ou ce sera bloqué ?

2 « J'aime »

Cette IA made in China, très très spécifique, est-elle une commande d’un certain Vladimir P. ? :slight_smile:

c’est quand même très bluffant !