Open ai ne viole aucun droit d’auteur, est ce que tu violes le droit d’auteur quand un cites un texte écrit par un philosophe et publié dans un livre ?
C’est bien plus complexe, pour une IA, Internet c’est la bibliothèque nationale. Une bibliothèque par définition est ouverte à tous sans devoir tenir compte de quelque droit que ce soit.
Une ia ne vend aucun concept ou idée qui aurait été imaginée ou conçue par d’autres.
Un moteur de recherche se concentre sur ce qu’on lui permet (il est limité) une ia c’est comme un Meta moteur de recherche, qui a accès à toutes les couches d’informations qui ne serait pas protégées par les codeurs, Administrateur de site d’informations. Il y a des lignes de code empêchent google de venir foutre son nez trop loin dans un site, ce sont les mêmes lignes qui limite les ia.
Dès lors tu ne peux reprocher un accès libre à une IA si le responsable du site ne faut rien pour protéger sa propriété
D’accord avec les prémisses. La conclusion est un poil abusive a minima. ^^
C’est encore en grande partie devant les tribunaux, y’a déjà eu des jugements et tout ce qu’on peut dire c’est « ça dépend du cas, de ta juridiction et de ton juge » Le NYT vs Open Ai ça traine depuis 2023 et le juge n’a pas balayé les claims d’un revers de main. A minima, ça veut dire que la plainte semble fondée et que c’est pas aussi claire que ça (dans un sens ou dans l’autre )
Ensuite il faut distinguer le fait d’entraîner des modèles sur des données et comment ont été obtenu ces données (coucou Meta ) dans un cas c’est juste du recel.
Il faut noter aussi que les boîtes elles mêmes semblent ne pas être ultra confiante vu la multiplication des tentatives pour trouver des accords avec les ayants droits.
Je suis chimiste et je l’utilise pour m’appuyer dans mon travail de recherche. La version gratuite m’est totalement inutile, en revanche la version payante me fait gagner un temps fou. Même à 50 ou 60 €, je pense que je continuerais à la payer avant de chercher une alternative.
C’est la preuve que la loi n’est pas claire et que l’interprétation de la loi est possible dans un sens comme dans l’autre, donc pas d’illégalité évidente, c’est ça le gros problème. Le consentement explicite et l’interdiction par défaut réglerait le problème.
L’infraction est caractérisée, pas besoin de plus pour condamner.
Le risque existe toujours, et si la jurisprudence devient en leur défaveur, ça risque de devenir compliqué, l’image peut aussi souffrir. Normal qu’ils tentent l’apaisement!
Sauf tu demandes explicitement de citer un texte (qui ressort d’ailleurs avec des imprécisions ou approximations mais qui reste un plagiat suivant les critères établis par la loi…), les résultats sont bien une « invention » de l’IA.
On est d’accord qu’il y a un problème sur l’exploitation du travail des autres pour l’entraînement, mais ce n’est pas du ressort de la gestion des droits qui protègent par rapport à une exploitation des oeuvres par des tiers non autorisés, donc bien du résultat de ce que le prompteur demande et non de la « formation » des IAs.
Reste que oui, les boites qui exploitent ces IAs profitent de ces oeuvres originales indirectement et c’est ça que la loi doit encadrer avec des droits particuliers.
Oui, mais encore une fois on oublie l’autre versant : pas évident que ce ne le soit pas non plus, les deux affirmations ont la même valeur : aucune. Je veux bien qu’on tronque la partie qui va pas, mais l’état de fait est qu’on en sait rien pour le moment.
Exact, c’est bien le signe que ce n’est pas évident pour eux non plus ^^ On est dans l’indéterminé. Et l’angoisse existentielle n’est pas loin
Je t’assure que non.
Une IA ne « régurgite » pas, ce n’est pas un algorithme qui a une mémoire figée, mais un ensemble de paramètres qui ont un comportement évolutif. Les données initiales ne sont pas mémorisées et dans ce sens, c’est bien une création.
Si il y eu violation des autorisations explicites, oui les boites d’IA sont en tort et il est facile de les faire payer. Mais le problème, c’est que l’utilisation des données pour de l’entraînement automatisé n’était même pas imaginé il y a 20 ans, et personne n’a pensé que cela deviendrait un process industriel il y a 10 ans, c’est un problème envisagé il y a seulement peut-être 5 ans, donc pas encore de copyrights adaptés (souvent l’utilisation pour l’enseignement et les citations sont autorisés par les copyright standards) ni de loi organisant l’activité.
Même le fichier robot.txt ne s’est adapté aux IAs que récemment alors que c’est la solution la plus simple et la plus efficace de gérer le problème! D’ailleurs il est intéressant de se souvenir que ce fichier a été instauré (dans la douleur?) pour un problème équivalent de récupération de données délicat, mais pour un autre usage: les moteurs de recherche.
Tout dépend du support. Dans l’EN française y’a un cadre assez … bref … et pas toujours très respecté ^^
Mouais ^^ ils respectaient pas les directive du robots.txt avant, j’imagine juste que c’est pour « référencer » les sources que ce fichier est utilisé. Pas pour l’entraînement. Parce que le user-agent: « * » n’avait pas besoin d’être mis à jour, ça voulait dire « t’es un robot ? tu crawles pas merci »
D’expérience c’est quand même assez respecté. Je n’ai que très peu de scans complets, et toujours depuis des pays ou il ne faut rien espérer de bon… Bon, OK mon site n’est pas très utile à une IA ou un robot d’indexation.
Mais les votes de contestation qui se basent sur des considérations personnelles et non sur l’ensemble de changements annoncés peuvent aussi mener à un gouvernement trop autoritaire. Les Américains en savent quelque chose, à présent.
Ils ont l’air de vachement souffrir ouais.
De un, c’est les Americains. Ils ont voté pour Trump, c’est leur choix. Dans quelques années, ils auront probablement à nouveau les démocrates. En fait, le fait qu’ils puissent enchainer Trump, puis Biden, puis à nouveau Trump… je trouve ça plutot rassurant sur les institutions.
De deux, ton propos est juste une généralisation et c’est le genre de propos qui a conduit la france a avoir le gouvernement ridicule qu’on a. A force de dire à la droite qu’elle ne doit plus assumer ses idées, on se retrouve avec un espece de centre mou contre des extremes. Tout le monde y perd.
On sait même plus si c’est du lard ou du cochon ^^
Alors celle là je dois avouer que je ne l’ai pas trop croisée. Enfin si chez des gens comme Zemmour et MMLP. Interessant. Et ça fonctionne comment au juste ? Qui a dit à la droite ce genre de choses et pourquoi ils l’ont fait ?
Je t’assure que je ne confonds pas « régurgitation et création », je suis conscient que dans certains cas très particuliers les IAs peuvent copier une création originale, seulement que ce n’est pas le fonctionnement que l’on attend des IAs (normalement…) et en général ce n’est même pas possible techniquement. J’utilise les IAs tous les jours pour leur créativité largement au delà de la créativité humaine, je n’ai que faire des concepts déjà explorés que l’on peut trouver sur internet ou dans la littérature spécialisée.
Bon, on ne va pas relancer la discussion . On n’est pas du tout d’accord sur le fonctionnement des IAs. J’ai l’impression que tu assimiles les IAs à des algos de mémorisation et restitution statistique. La partie statistique est un raccourci pour les LLM, mais c’est TRES réducteur.
Il a pourtant raison. Le fonctionnement d’une IA générative ne consiste pas à stocker des données pour les régurgiter.
Une IA générative est plus comparable à un cerveau qu’à un disque dur. L’apprentissage crée des « connexions » entre des nœuds, connexion dont l’intensité va varier au fil du processus d’apprentissage, mais les données d’apprentissage ne sont PAS enregistrées dans le modèle.
C’est d’ailleurs pour ça qu’un LLM est bien incapable de citer ses sources (quand un chat IA cite des sources, c’est qu’il y a eu du RAG, ça ne vient pas du modèle). Parce que justement, ce n’est pas enregistré. Tout comme tu serais incapable de me citer ta source si je te demande qui était président de la France en 1984, même si tu connais très bien la réponse.
Suffit d’ailleurs de voir la taille que fait un modèle de génération d’image comme flux pour comprendre que non, ce n’est pas possible qu’il ait mémorisé toutes ses données d’apprentissage pour pouvoir les régurgiter…
Sauf que là on parle justement d’aspect techniques : les données d’apprentissage sont-elles ou non stockées dans le modèle ?
Pour « régurgiter » comme tu le prétends, il faut qu’elles soient stockées. Ce n’est pas le cas.
Quand à la créativité, oui, à partir du moment où une IA est capable de produire quelque chose d’original, qui n’a été créé par personne d’autre avant, c’est bien une forme de créativité.
Un peu de mal à comprendre là. La première définition je veux bien elle est claire, mais du coup, la création est un acte quasi impossible. Définition que tu affadis immédiatement en faisant entrer en jeu l’inspiration qui en fonction de la quantité présente devient du plagiat… et les ia génératives ne seraient que plagiat ? C’est ça ?
Perso la question que j’aimerai poser à ABC pour clarifier son propos c’est surtout : est-ce que selon lui tout, absolument tout ce qui est généré par une IA est plagiat ?