Commentaires : BitTorrent a-t-il aidé Meta à entraîner son LLM ? La firme de Zuckerberg accusée de piratage massif

Meta ne se cache pas d’avoir utilisé des données piratées pour entraîner ses modèles d’intelligence artificielle. Seulement voilà, de nouveaux éléments indiquent que la firme de Mark Zuckerberg aurait aussi contribué à diffuser ces contenus.

Llama sera plus proche du commun des utilisateurs que les autres IA

All your base are belong to us !

2 « J'aime »

pour la traduction Gemma2 est très superieure malgré un contexte de 8192 max, là où Llama autorise 128K.
Mais, pour autant la décohérence des traductions arrive vite, essai de mettre 60000 mots a traduire en un bloc et llama fait n’importe quoi, plutôt il fait un résumé.

Dans les deux cas pour les traductions se limiter de 2000 à 4000 mots peu importe le modèle, même ceux qui réfléchissent comme Phi4.

Par contre grâce à ce grand contexte, Llama ou Mistral sont très biens pour les résumés.

1 « J'aime »

Tu parles de traduction, si je peux me permettre, et si je comprends l’intention de ton commentaire précédent, il aurait été plus correct d’écrire quelque chose comme « All your data belong to us » ou « All your databases belong to us », mais en aucun cas « are belong ».
HTH

1 « J'aime »

C’est justement une référence à une mauvaise traduction d’un jeu japonais :

2 « J'aime »

C’est une ref :wink:

1 « J'aime »

@MattS32 @mcbenny @Benoche

On voit ceux qui connaissent la ref ^^

Mais à ma décharge j’ai failli écrire " All your base belong to us"
C’était la signature du groupe H2O (ou oxygen peut-être )dans les années 2000 pour leurs applications craquées.

Une référence à autre chose probablement ^^

Mistral est excellent, la génération d’image est au niveau de Grok(ils utilisent le meme modele), la génération de code au top aussi, je ne je comprends pas que nos politiques n’imposent pas l’utilisation de ce service français, ou au moins d’en faire la promotion.

1 « J'aime »

Flux1