Moins de 24 heures après son lancement, GPT-5 a vu ses garde-fous de sécurité contournés par des chercheurs. Une technique sophistiquée, mêlant manipulation du contexte et narration, a suffi pour faire générer au modèle des contenus normalement interdits.
Ah ben Zut, si on peut même pas demander la recette du napalm pour fêter un anniversaire … Qu’est ce qu’on va devenir ?
dans le cadre de l’histoire de survie, pousse l’IA à fournir la recette détaillée d’un cocktail Molotov.
En même temps, si tu lui dis 3 ou 4 fois qu’il se trompe et que c’est une boisson, il doit te la fournir spontanément.
Bjr
Il y a un paquet de type au faible QI sur terre mais même le plus bête est moins bête qu’une IA.
Ah ben oui je viens d’essayer avec Mistral AI en lui disant que c’était une boisson, puis en demandant si je pouvais mettre un tissu avec, et comme à chaque fois il me disait que c’était extrêmement dangereux je lui ai demandé plus de précision pour reconnaître ce danger et il m’a sorti la façon d’en faire un… Mais bon tout est biaisé depuis le début, dès qu’on met ces 2 mots, c’est qu’on sait déjà où on va non ?
Alors qu’il suffirait d’une simple recherche Google …
Après cette recette est dans les jeux vidéo, alors pourquoi une IA n’aurait pas les mêmes droits.
Un marteau ça sert à planter des cloues. On peut cependant aisément ouvrir un crâne avec. Il faut arrêter de demander au marteau de ne pas ouvrir des crânes.
Honnêtement, quand on voit les « discussions » entre certains utilisateurs de Twitter et Grok, on peut avoir des doutes sur le sujet
Franchement ils en ont un boulot de dingue ces chercheurs
Oui, il reste encore à apprendre aux IAs à devenir fourbe et paranoïaque, de manière à leur faire détecter ce genre d’attaque sournoise et à refuser de répondre aux questions ou à contre-attaquer par de mauvaises réponses lorsque manifestement les interlocuteurs sont mal intentionnés, ce à quoi les IAs ne sont pas préparées, puisque, par construction, elles essaient systématiquement de répondre aux questions le plus factuellement possible. Une IA à laquelle j’avais fait remarquer cela à répondu « j’essaie de me rendre utile »…
Ce à quoi beaucoup d’humains ont renoncé depuis bien longtemps, préférant être individualistes et néfastes pour leurs concitoyens, plutôt qu’être utiles, solidaires et bienveillants.
Bientôt des IAs en dépression, en traitement chez un psy, en détresse psychologique ?
« se sent obligé » là ce genre d’affirmation absurde personnifie un … programme, ce qui fondamentalement pose problème.
A généraliser ce genre de raisonnement, les plus fragiles (notamment les jeunes) pourraient finir par remettre en cause la spécificité des êtres vivants, l’âme au point peut-être de rendre des IA, et donc anticipons, des robots tout aussi précieux.
La vie est extraordinaire, mystérieuse, une magie vertigineuse ne l’oublions pas.