Commentaires : Meta a-t-elle formé son IA sur des livres piratés ? De nouveaux éléments explosifs émergent

Mathieu_G · Février 10, 2025, 12:30

Les pratiques de Meta en matière d’entraînement de l’IA sont à nouveau mises en cause. Des documents internes récemment dévoilés révèlent l’utilisation présumée d’ouvrages piratés pour alimenter ses modèles.

https://clubic.com//actualite-553038-meta-a-t-elle-forme-son-ia-sur-des-livres-pirates-de-nouveaux-elements-explosifs-emergent.html

Hanandano · Février 10, 2025, 12:30

Petit tuto de GAFAM :

faire des trucs dont on sait pertinemment que c’est pas légal mais dont on pense que ça nous donnera un avantage compétitif
se foutre de la gueule du monde (« c’est pas nous »)
engranger les bénéfices / investissements massifs permis par l’avantage en question
payer les amendes minables qui ne sont même pas dans le bon ordre de grandeur, on devrait d’ailleurs appeler ça « impôt sur le balec de la loi frer »

a-snowboard · Février 10, 2025, 12:36

pas à franchir la ligne jaune et à utiliser des sources d’information et de connaissances protégées par le droit d’auteur.

Ah c’est une ligne jaune de piller le droit d’auteur ? Bientôt la ligne bleu, verte, rose ?

a-snowboard · Février 10, 2025, 12:36

C’est exactement ça.

jvachez · Février 10, 2025, 12:53

En même temps ils n’ont pas vraiment le choix, une IA ça a besoin d’énormément de données, ça coûterait des milliards s’il fallait qu’ils payent tout, la fortune de Zuckerberg ne suffirait même pas.

nicgrover · Février 10, 2025, 12:56

Sauf que les milliards, ils les ont.

Mimi9 · Février 10, 2025, 1:21

Plus de 80 Go de livres téléchargés illégalement selon des mails internes
Meta aurait ainsi téléchargé au moins 81,7 téraoctets de données issues de bibliothèques illégales, notamment Z-Library et LibGen, via le site Anna’s Archive.

Go ou To ?

juju251 · Février 10, 2025, 2:29

Évidemment Zuckerberg sera poursui et risquera jusqu’à 35 ans de prison …

Pour ceux qui ne voient pas à quoi je fais référence :

https://fr.wikipedia.org/wiki/Aaron_Swartz

Section biographie / affaire Jstor.

Hanandano · Février 10, 2025, 9:35

The new evidence showed that Meta torrented « at least 81.7 terabytes of data across multiple shadow libraries through the site Anna’s Archive, including at least 35.7 terabytes of data from Z-Library and LibGen, » the authors’ court filing said. And « Meta also previously torrented 80.6 terabytes of data from LibGen. »

La source de l’article parle bien de terabytes si ça répond bien à la question.

lewisfineley · Février 13, 2025, 6:30

Cette mentalité sans déconner…