Commentaires : Meta a-t-elle formé son IA sur des livres piratés ? De nouveaux éléments explosifs émergent

Les pratiques de Meta en matière d’entraînement de l’IA sont à nouveau mises en cause. Des documents internes récemment dévoilés révèlent l’utilisation présumée d’ouvrages piratés pour alimenter ses modèles.

Petit tuto de GAFAM :

  • faire des trucs dont on sait pertinemment que c’est pas légal mais dont on pense que ça nous donnera un avantage compétitif
  • se foutre de la gueule du monde (« c’est pas nous »)
  • engranger les bénéfices / investissements massifs permis par l’avantage en question
  • payer les amendes minables qui ne sont même pas dans le bon ordre de grandeur, on devrait d’ailleurs appeler ça « impôt sur le balec de la loi frer »
5 « J'aime »

pas à franchir la ligne jaune et à utiliser des sources d’information et de connaissances protégées par le droit d’auteur.

Ah c’est une ligne jaune de piller le droit d’auteur ? Bientôt la ligne bleu, verte, rose ?

1 « J'aime »

C’est exactement ça.

En même temps ils n’ont pas vraiment le choix, une IA ça a besoin d’énormément de données, ça coûterait des milliards s’il fallait qu’ils payent tout, la fortune de Zuckerberg ne suffirait même pas.

Sauf que les milliards, ils les ont.

4 « J'aime »

Plus de 80 Go de livres téléchargés illégalement selon des mails internes
Meta aurait ainsi téléchargé au moins 81,7 téraoctets de données issues de bibliothèques illégales, notamment Z-Library et LibGen, via le site Anna’s Archive.

Go ou To ?

3 « J'aime »

Évidemment Zuckerberg sera poursui et risquera jusqu’à 35 ans de prison … :smirk:

Pour ceux qui ne voient pas à quoi je fais référence :

Section biographie / affaire Jstor.

3 « J'aime »

The new evidence showed that Meta torrented « at least 81.7 terabytes of data across multiple shadow libraries through the site Anna’s Archive, including at least 35.7 terabytes of data from Z-Library and LibGen, » the authors’ court filing said. And « Meta also previously torrented 80.6 terabytes of data from LibGen. »

La source de l’article parle bien de terabytes si ça répond bien à la question.

2 « J'aime »

Cette mentalité sans déconner…