Commentaires : OpenAI et Microsoft auraient-elles volé nos données personnelles pour entraîner leur IA?

Le créateur de ChatGPT, OpenAI, et le géant Microsoft sont accusés d’avoir violé la vie privée des utilisateurs, faisant désormais face à un recours collectif outre-Atlantique.

Comment ? Mais qu’est-ce que j’ entends ? Des voleurs de données personnelles américains ?
Non, je me refuse d’y croire

3 « J'aime »

non, j’y crois pas :'D

1 « J'aime »

En tout cas on ne peut pas dire que les IA détruisent des emplois, elles en créent dans le domaine de la justice :joy:

5 « J'aime »

On ne peut pas parler de pillage alors que les données sont accessibles pour tout un chacun!
Par contre, il faut que les copyrights soient respectés et que les rémunérations associées soient négociées AVANT utilisation.
Cependant, comment régler ce problème puisque les données ne sont utilisées que pour « inspiration » et qu’il n’y a pas techniquement de plagiat…

2 « J'aime »

Malheureusement peu de journalistes a le courage d’enquêter sur ces vols et le dénoncer, ilq risquent de perdre leurs cartes et leurs avantages fiscaux.

Pour le moment beaucoup de suppositions et d’accusations mais pas la moindre preuve.

Ce sont les bases de données d’entrainement utilisées et les copyrights associés qu’il faut revoir. Voir même la notion de protection intellectuelle.

C’est le principe même de la plupart des IAs: l’entrainement génère un réseau de neurone (ou équivalent) et les données ne sont pas « mémorisées ». D’ailleurs justement, c’est pourquoi dans ce cas on ne peut faire AUCUN lien entre les oeuvres utilisées pour l’entrainement et le résultat, donc les références ne sont pas identifiables. C’est vraiment de l’inspiration, et pas de la copie, la limite avec le plagiat est très complexe a déterminer.

Tout à fait, mais l’imitation est différent du vol, ou alors il revoir la notion de vol/plagiat…

Comme beaucoup d’outils! Ces outils permettent de combler un manque de technique, un manque de temps ou une complexité qui est alors automatisée / robotisée. Va donc faire un programme complexe sans IDE ni librairie, construire une voiture sans robot, concevoir un avion sans CAO, monter un film en analogique, ou même apprendre la photo en argentique, … Tout ça est tout à fait possible, mais des outils adaptés permettent un gain de temps énorme et de se passer de certaines compétences!
En poussant ton raisonnement, il faudrait interdire les outils numériques pour la plupart des arts.

Comme je l’ai déjà expliqué, c’est de l’inspiration dans le fonctionnement, reste à mieux définir la notion de plagiat et surveiller l’utilisation des ouvres pour l’entrainement. Mais je suis d’accord sur le fait qu’il faut protéger le travail original, tout comme il faudra protéger les prompts des utilisateurs d’IA à terme.
Et un artiste ne se résume pas à une technique ou un style. Un tableau « à la façon de » ne sera probablement pas un bon tableau si la composition est mauvaise, si il n’y a pas d’idée derrière ou encore si le sujet est inintéressant (ou le détournement du sujet religieux comme souvent pour les peintres « classiques »), ce que ne fera pas une IA, ça sera l’« artiste » qui va créer un prompt qui créera vraiment l’âme de l’oeuvre.

L’info des bases d’entrainement est souvent disponible, et d’ailleurs c’est pour ça que les données utilisées sont en général pas à la page. Le problème est / sera plutôt sur les bases basées sur un entrainement constant en piochant sur internet, il faudra forcément un mécanisme (un tag? un copyright particulier) pour la gestion de l’autorisation de l’utilisation comme donnée d’entrainement.

Cela va peut-être t’étonner, mais les IAs sont un atout indéniable pour la R&D, en effet l’esprit humain est très limité pour gérer de grande quantité d’information, il est limité par ses capacités et ces biais (même si les IAs ont aussi des biais, résultat soit des biais de sélection des bases d’entrainement, soit de leur fonctionnement proche de l’humain avec des à peu près pas toujours fiable, appelé « le bon sens »…).
Mais je te rassure, les sorties des IAs passent par le même cheminement de revue, simulation et validation que n’importe quelle idée humaine!

La dessus je te rejoins. Des utilisateurs d’IA les utilisent pour générer du contenu bullshit sans aucune valeur ajoutée et aucune vérification, là c’est de l’arnaque pure, sauf que l’incompétence (volontaire?) ne vient pas de l’IA mais des utilisateurs de ces IA. Les IAs génératives n’ont effectivement que la compétence d’imitation, pas de création. Après, il n’y a pas que des IAs génératives…

C’est pour ça qu’il faut cadrer les entrainements, les ressources disponibles sur le net sont quelques fois libres d’accès, mais pas toujours.

C’est aussi ce que je pense. Mais il faut redéfinir légalement le cadre du plagiat en tenant compte de ce nouvel usage, les juges ne font qu’estimer la légalité que les lois définissent!