Des chercheurs ont généré les expressions faciales de leur robot grâce à GPT-3, le modèle de langage d’OpenAI sur lequel est basé ChatGPT. Le résultat est tout simplement bluffant.
Ça devient effrayant. Entre les fakes videos qui commencent à être probantes, les AI qui font des scores énormes sur différents tests et maintenant ça. On verra ou ça nous emmène.
Pendant ce temps je vais relire Asimov.
C’est effectivement le moment de (re)lire Asimov.
Fascinant.
Si déjà d’entrée on lui inculque que ce n’est pas un être humain et qu’il ne pourra jamais ressentir du plaisir ou de la joie, il va finir dépressif comme ce pauvre Marvin dans H2G2!
Super, on va pouvoir remplacer 90% des politiciens de tous bords.
Brasser de l’air et faire semblant de donner le change sur du vide, c’est leur point commun avec cette machine à grimaces.
Une perruque, un costard et le tour est joué.
Cyberdine arrive doucement mais sûrement… A quand le non retour en arrière ???
J’avoue ne pas avoir tout lu… l’oeuvre complete est costaud.
ça me semble très artificiel et absolument pas réaliste du tout.
Déja la voix manque d’intonnations, de vie, de substance.
En soit, il ne sert à rien de bouger des lèvres si le son sort d’un micro, c’est une logique et ça donne la différence entre ce qui est réaliste et ce qui ne l’est pas.
le mouvement des yeux est exagéré et ne répond pas à une logique spécifique.
Les yeux sont faits pour voir.
par delà cette évidence, il est aussi le reflet de notre champs de vision limité.
et voir, mais voir quoi et dans quel but ?
les mouvements d’expréssion du visage sont outrés et pour le coup, volontaires.
une expréssion de visage est souvent un mouvement involontaire traduisant une conscience et une pensée se traduisant physiquement.
Or, Chatgpt, si on le lui demande explique bien qu’il est un programme de langage.
Il n’a pas de sexe, pas de conscience, pas de sentiments ni d’émotions, tout du moins dans sa version grand public où cette vidéo est sensée faire appel.
Ainsi, ça n’a rigoureusement aucun intérêt à ce stade de présenter ce type de vidéo si ce n’est produire un contenu commercial repris dans différents sites y compris celui de Clubic.
Pour un sujet qui n’a aucun intérêt vous me paraissez plutôt disert.
Les arguments que vous avancez sont intéressants sur certains points mais il faut se dire que cette interface est une étape comme il y en a eu beaucoup déjà et bien moins convaincantes.
L’interaction avec des robots est particulièrement étudiée, les expressions du visage sont un premier pas très important pour la compréhension d’un échange car tout ne peut passer juste par l’intonation de la voix. Je peux vous renvoyer par exemple aux travaux du professeur Hiroshi Ishiguro sur le sujet.
L’utilisation de ChatGPT (ou d’une autre IA grand public) arrive en complément de tout ce qui a été fait jusque là mais de manière limitée au monde de la recherche ou universitaire.
Et pour compléter, je peux aussi avancer que les scientifiques ont toujours besoin de publicité pour leurs travaux, c’est comme ça qu’on obtient des financements.
@Karnag :
Tu peux te concentrer sur ses œuvres sur les robots, par le biais du « Grand livre des robots » (2T) par exemple ou des publications liée au « Cycle des robots »
C’est clair que les humains n’ont pas autant d’expressions sur le visage. Là, on dirait une succession de emojis à chaque phrase comme on a l’habitude de les singer sur les salons de chats et les forums.
Par exemple, on met « LOL » à tout va mais ça ne veut rien dire et ça ne reflète pas la subjectivité de la personne.
Ce qui compte le plus tout de même, c’est l’avancée techonologique.
Bien alors…
Ce n’est pas chat gpt, qui est un chat…
C’est le model de deep learning gpt3 entrainé avec des images d’expression humaine !
Pour info gpt3 ce trouve sur le net bon pour l’entraîner il faut des tonnes de données et des milliers d’heures de processeurs.
La seule vraie avancée c’est gpt4 qui ce veut multimodal.
Mais le vrai buzz est qu’openai après avoir décidé de ne plus être open ne respecte pas la règle toujours respectées jusqu’ici DONNÉ LA STRUCTURE DE SON MODÈLE, nombre de paramètres etc…
Et ça c’est un tournant dangereux
C’est qu’étant occupé à des achats importants, je dérive de sujet en allant regarder ce qui se passe à droite et à gauche et en effet, je tombe sur ce sujet qui paraissait intéréssant au 1er abord mais qui en définitive, me semble totalement dénué d’intérêt étant donné la pauvreté du résultat fourni.
Les expréssions d’un visage sont très important, c’est vrai, mais ils doivent être réalistes au risque de perturber le message transmis.
un être humain qui regarde entièrement à droite et à gauche quand il parle, cela va m’inquiéter.
de même s’il change complétement d’expréssion de visage sans motifs, c’est ennuyeux.
Pour être honnête, j’avais une idée un peu naive du sujet en imaginant une vidéo type « kara de Détroit », qui était une vidéo très bien faite je trouve où là, la simulation paraissait « vivante ».
Je pense que l’intérêt de cette vidéo va avec ta conclusion parfaite:
« e peux aussi avancer que les scientifiques ont toujours besoin de publicité pour leurs travaux, c’est comme ça qu’on obtient des financements. »
c’est juste exactement ça. C’est pour obtenir des financements.
Mais on est super loin d’une application pratique à ce stade.
On ne peut pas imaginer là une simulation réelle sur le terrain d’un agent d’accueil comme ça.
J’espere un progrès plus important que ça pour l’avenir.
Chatgpt, surtout récemment depuis que c’est quasi instantané, c’est réellement quelque chose de consistant et concret.
Mais grave, je ne vois rien de réaliste ici.
Aucune cohésion ou presque entre le « discours » et les « expressions ».
La coordination avec leur robot qui existait déjà est encore à améliorer mais même avec la structure actuelle de GPT-3 on peut obtenir des expressions, soient-elles exagérées ou non.
La plupart des IA utilisées jusqu’ici étaient développées spécifiquement pour une adéquation fidèle entre propos et expression. Le fait qu’un outil généraliste comme Chat-GPT soit capable de produire lui-même discours et expression est intéressant en soi.
j’en convient, il aurait fallu simplement attendre encore un peu pour que ça soit plus naturel.
C’est moi ou personne ne réagit à ce que l’IA dit dès le début sur un sentiment de Gaité puis de tristesse…
L’IA dit quand même que son plus grand bonheur a été quand iel à été activé. Et qu’iel à ressenti la vie…
Et qu’en tristesse iel ne connaîtra jamais l’amour…
Et puis. J’utilise ce fameux pronom ‹ iel › car c’est ni une femme. Ni un homme.
On y est !
sinon : la façon dont le visage se déforme de façon réaliste est assez bluffante… les yeux sont le reflet de l’âme et le coté vitreux n’apporte pas, mais si vous croisez quelqu’un qui met des lentilles colorées ça fait un peu ça aussi
dans 30 ans ça fait flipper ce qu’on va pouvoir faire… des pans entiers de société vont se retrouver cul nu car ne servant à rien sur le papier. Et les autres seront en névrose de manque d’interaction sociale si ces trucs se généralisent (ce qui se fera dès que ça coûtera moins cher qu’un humain sur coût complet calculé à 5-7 ans)
On parlait d’Asimov… moi je repense à Herbert (Dune) : le Jihad Butlérien c’est l’éradication des machines pour miser sur l’humanité transcendée, justement parce qu’à un moment ça commençait à sentir le roussi… une autre façon de voir un avenir
Ne pas oublier qu’il faut aussi savoir serrer des mains, caresser les joues des bébés et pointer quelqu’un du doigt. ^^
Sinon, ils auront beau faire tout ce qu’ils veulent, il y a une chose qui n’est pas près d’arriver, et elle concerne les yeux. On dit que les yeux sont les miroirs de l’âme et c’est totalement vrai, aucun robot ne pourra jamais faire transparaître la personnalité et le caractère qu’il n’a pas.
Le jour le plus heureux: « Il n’y a rien de tel que d’expérimenter la vie pour la première fois, n’est-ce pas ? ».
Heu… donc les bébés qui hurlent à la naissance, c’est de la joie ? On m’aurait menti ?!