Commentaires : NVIDIA utiliserait des vidéos YouTube et Netflix pour former son IA, sans en avoir l'autorisation

Pour entraîner son intelligences artificielle, le géant NVIDIA téléchargerait des milliers de vidéos YouTube et Netflix. Problème : l’entreprise le fait sans autorisation, et la question des droits d’auteur se pose.

https://clubic.com//actualite-534365-nvidia-utiliserait-des-videos-youtube-et-netflix-pour-former-son-ia-sans-en-avoir-l-autorisation.html

Il n’est pas mis librement à disposition. Il y a des conditions d’utilisations définies par YouTube.

Les contenus proviennent des utilisateurs, oui. Mais c’est YouTube qui fournit le service d’hébergement et d’accès, et donc fixe les conditions dans lesquelles on peut y accéder sur ses serveurs (si les propriétaires de ces contenus veulent les mettre en accès « libre », ils le peuvent, mais pas via YouTube, qui fixe des conditions d’accès) et ce qu’on peut en faire ou non, ce n’est pas libre.

https://www.youtube.com/static?template=terms&hl=fr&gl=FR

En particulier, les conditions d’utilisations précisent ceci :

L’entrainement d’une IA, ça me semble bien contrevenir à ces deux points, d’une part c’est un robot, d’autre part ce n’est pas un usage personnel et non commercial.

Et nVidia a beau prétendre qu’ils sont dans les clous, le fait qu’ils aient dû recourir à des astuces pour ne pas se faire détecter et bloquer montre bien qu’ils sont parfaitement conscient d’avoir fait un truc pas clair…

Quand au point sur le droit d’auteur, ça n’est pas le sujet ici : oui, nVidia a peut-être respecté le droit d’auteur en ne prenant que des vidéos dont les ayant-droits autorisent cet usage. Mais ça ne les autorise pas pour autant à ne pas respecter les règles de la plateforme qui les héberge, l’œuvre et son support ne sont pas soumis à la même législation.

Pour faire une analogie, certes un peu extrême, quand Folio imprime « Les Misérables », texte qui a depuis longtemps été élevé dans le domaine public, pour en faire un livre, je n’ai pas le droit de prendre un exemplaire de ce livre sans le payer à Folio sous prétexte que son contenu est libre… Et pourtant, je respecte bien le droit d’auteur si je fais ça.

1 « J'aime »

Le législateur Américain a tranché. C’est le copyright choisi par l’auteur du contenu qui compte, pas les TOS de la plateforme, dans le cadre du scraping du contenu publié sur des plateformes pour de l’entraînement d’IA. https://www.afslaw.com/perspectives/ai-law-blog/can-you-prevent-ai-scraping-your-website-data-district-court-says-answer#:~:text=Though%20many%20websites%20have%20attempted,governed%20by%20federal%20copyright%20law.

Ah merci, j’avais pas vu passer cette info.

Nvidia va jouer sur l’aspect légal, en disant qu’ils ne font qu’utiliser du contenu libre d’accès sans chercher à le rediffuser ou à en tirer profit directement.

Évidemment, c’est tout à fait spécieux. YouTube et Netflix sont des plateformes permettant le visionnage et rien d’autre. Néanmoins, j’espère que YouTube a bien bétonné ses règles d’utilisation parce qu’Nvidia risque de jouer sur la moindre ambiguïté.