Les pratiques de Meta en matière d’entraînement de l’IA sont à nouveau mises en cause. Des documents internes récemment dévoilés révèlent l’utilisation présumée d’ouvrages piratés pour alimenter ses modèles.
Petit tuto de GAFAM :
- faire des trucs dont on sait pertinemment que c’est pas légal mais dont on pense que ça nous donnera un avantage compétitif
- se foutre de la gueule du monde (« c’est pas nous »)
- engranger les bénéfices / investissements massifs permis par l’avantage en question
- payer les amendes minables qui ne sont même pas dans le bon ordre de grandeur, on devrait d’ailleurs appeler ça « impôt sur le balec de la loi frer »
pas à franchir la ligne jaune et à utiliser des sources d’information et de connaissances protégées par le droit d’auteur.
Ah c’est une ligne jaune de piller le droit d’auteur ? Bientôt la ligne bleu, verte, rose ?
C’est exactement ça.
En même temps ils n’ont pas vraiment le choix, une IA ça a besoin d’énormément de données, ça coûterait des milliards s’il fallait qu’ils payent tout, la fortune de Zuckerberg ne suffirait même pas.
Sauf que les milliards, ils les ont.
Plus de 80 Go de livres téléchargés illégalement selon des mails internes
Meta aurait ainsi téléchargé au moins 81,7 téraoctets de données issues de bibliothèques illégales, notamment Z-Library et LibGen, via le site Anna’s Archive.
Go ou To ?
Évidemment Zuckerberg sera poursui et risquera jusqu’à 35 ans de prison …
Pour ceux qui ne voient pas à quoi je fais référence :
Section biographie / affaire Jstor.
The new evidence showed that Meta torrented « at least 81.7 terabytes of data across multiple shadow libraries through the site Anna’s Archive, including at least 35.7 terabytes of data from Z-Library and LibGen, » the authors’ court filing said. And « Meta also previously torrented 80.6 terabytes of data from LibGen. »
La source de l’article parle bien de terabytes si ça répond bien à la question.
Cette mentalité sans déconner…