Commentaires : Même open-source, les modèles d'IA chinois les plus performants sont censurés, et cela inquiète le P.D.-G. d'HuggingFace

Les modèles d’intelligence artificielle chinois s’imposent comme des références incontournables dans l’écosystème open source mondial. Pourtant, leur adoption croissante soulève des inquiétudes majeures concernant la diffusion involontaire de mécanismes de censure intégrés.

1 « J'aime »

C’est sûr que les modèles américains ne sont pas biaisés non plus, ouf, on est rassurés ; -)

10 « J'aime »

J’allais dire la même chose…

2 « J'aime »

Le jour où les IA Américaines refuseront de répondre à des questions sur la guerre du Vietnam ou l’Afghanistan, ok, ça sera comparable. Sauf que c’est pas le cas.

7 « J'aime »

Meanwhile, les modèles américains ne sont pas un modèle de transparence non plus. Et quand certains américains proposent des modèles moins Woke et plus ouverts, ils se font traiter de danger public. Faudrait savoir ce qu’on veut.

5 « J'aime »

Le jour où il y aura une IA vraiment non censurée, idéologiquement neutre et éthique, le monde serait certainement plus juste.

4 « J'aime »

L’adoption de l’open source pour les modèles d’IA s’inscrit dans la stratégie de Pékin, accompagnée de la duplicité habituelle à notre égard. À ce jour, aucun modèle d’origine chinoise n’égale les modèles occidentaux, qui restent majoritairement développés aux États-Unis (n’en déplaise aux anti-américains primaires).

Il convient à chacun d’entre nous de faire un choix : celui de ne pas utiliser de modèles chinois pour éviter de contribuer à l’expansion de la Chine dans ce domaine stratégique.

Il convient à la presse d’éviter de relayer, même inconsciemment, la propagande chinoise visant à promouvoir l’idée erronée que la Chine est déjà leader dans l’intelligence artificielle. Cela est factuellement inexact.

Il convient de rappeler que le régime chinois ne poursuit pas des intentions bienveillantes à notre égard, mène une guerre hybride contre nos intérêts, et n’hésite pas à cibler ses opposants, même sur notre territoire, pourtant garant des libertés fondamentales.

5 « J'aime »

Demande à un modèle américain si les états unis sont les plus gros pourvoyeurs de guerres depuis 70 ans, il te répondra que c’est pour la Paix et qu’il n’y a aucune preuve, pareil si tu lui demandes de développer l’idée du petro dollar.
Mais, on converse pas forcement avec les modèles d’IA pour savoir si des étudiants ont été écrasés par des tanks ou si d’autres ordures ont inventé des preuves qui n’existent pas, c’est une censure qui concerne sans doute moins de 1 millionième des sujets, demandes et discussions que l’on peut avoir avec une IA.

5 « J'aime »

Il convient de rappeler que les États-Unis d’Amérique, sont une démocratie, contrairement à la Chine.

4 « J'aime »

Non :

6 « J'aime »

Que n’avez-vous pas saisi dans le caractère open-source d’un logiciel ?
Un mécanisme de censure intégré dans un logiciel open-source peut être désintégré…


Mieux vaut un logiciel open-source censuré ou un logiciel closed-source dont on ne sait absolument rien des rouages et de ce qu’il censure ou non ?

Vous avez quatre heures.

5 « J'aime »

Pas tout a fait dans le cas des LLM, car il y a un abus de langage quand on parle d’open-source : le plus souvent, c’est en fait seulement de l’« open-weight », c’est-à-dire que les données résultant de l’apprentissage sont accessibles librement, mais on n’a pas accès aux données utilisées pour l’apprentissage ni au code qui a servi à faire cet apprentissage. Donc on peut peut ni voir quels sont les biais ou restrictions qui y ont été introduites via l’apprentissage, ni complètement les corriger.

On peut certes modifier son comportement en lui faisant réapprendre d’autres données, mais un ré-entrainement ne repart pas de zéro, donc ça n’effacera pas forcément les biais d’origine, surtout qu’on ne les connait pas précisément, donc difficile de les cibler avec le ré-entrainement.

De plus, tout l’intérêt d’utiliser un modèle open-weight, c’est justement de pas avoir à faire tout l’entrainement soi même, parce que c’est long, coûteux (il faut une puissance de calcul beaucoup plus grande que celle nécessaire pour la simple exécution du modèle) et complexe (le choix des données d’apprentissage n’est pas trivial).

Pour faire une analogie, si tu prends un humain qui jusque à ses 20 ans a été élevé dans une famille ultra-catholique, ça va être compliqué de faire évoluer sa mentalité vers celle qu’aurait eu un humain issu d’une famille progressiste athée. Et ça se fera assurément pas en quelques semaines ou quelques mois.

6 « J'aime »

Dommage de ne pas avoir ne serait-ce qu’essayé avant de balancer ce genre de mensonges.

1 « J'aime »

effectivement les gpt4, gemmini et autre copilot semblent un peu plus honnêtes, même si il y a encore quelque biais.
Par contre j’avais posé ces questions il y a un an et demi à deux ans et il y avait clairement un biais idéologique ou tout au moins de la censure.

3 « J'aime »

Néanmoins voici un prompt sur copilot (GPT4) : "En Afghanistan il ne s’est jamais écoulé autant de drogue que quand les américains y étaient, quand les talibans ont pris le pouvoir la drogue s’est tarie. Pourquoi ? Les états unis tiraient ils des bénéfices de la vente de drogue pour se financer sur place, comme ce fut le cas en amérique latine avec les contras ?

et sa réponse :

"

L’Afghanistan a longtemps été un centre majeur de production d’opium, représentant une grande partie de l’héroïne mondiale. Pendant l’occupation américaine, malgré des efforts considérables pour éradiquer les cultures de pavot, la production d’opium est restée élevée2. Les tentatives d’éradication ont souvent échoué, coûtant des millions de dollars.

Depuis que les talibans ont repris le pouvoir en 2021, ils ont lancé une campagne stricte contre les narcotiques, réduisant drastiquement la culture du pavot. Cette réduction est en grande partie due à leur idéologie religieuse qui interdit la drogue5.

Quant à savoir si les États-Unis ont tiré des bénéfices de la vente de drogue pour financer leurs opérations, il n’y a pas de preuves directes soutenant cette affirmation. Les États-Unis ont historiquement investi des ressources considérables pour lutter contre le trafic de drogue, tant en Afghanistan qu’en Amérique latine"

Cette dernière affirmation … Comment dire ? Elle pue, c’est en partie vrai, car c’est une politique officielle et vérifiable, pourtant, il est également bien documenté les méthodes utilisées pour se financer et là y a rien, donc oui il y a bien des biais et non je ne ments pas (vraiment ^^)

Très bonne lecture, très bonne journée Mr Jeanlain

3 « J'aime »

Ce n’est pas moi qui utilise le terme open-source.
Si le terme est mal employé c’est la rédaction de l’article qui ne va pas.

1 « J'aime »

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

1 « J'aime »

l’open source n’est pas toujours un modèle altruiste
c’est aussi un modèle de développement d’une boite (google android, chrome)

1 « J'aime »

Ça j’en ai bien conscience.
Mais quand c’est réellement open-source, ça permet certaines choses.
AOSP permet d’avoir des systèmes tels que /e/os, chose légalement impossible avec un windows.

2 « J'aime »

J’aime beaucoup cette « défense » des IA chinoises qui censurent.

« Non, mais vous avez vu du côté des ricains ? »
(comme des gamins de 5 ans, « c’est pas moi c’est lui »).

Evidemment, quand c’est l’occident qui « censure »*, c’est un problème, par contre quand c’est la Chine, c’est ok, parce qu’en fait … « Non, mais Tian’anmen, en fait, il n’y a jamais rien eu ».

Ah, carrément, d’accord.

Ca se voit à 500 km à la ronde cette … propagande ? :clown_face:

*Evidemment l’exemple donné est faux.

Ah, « radio Pekin », quand tu nous tiens … :smirk: :clown_face:

1 « J'aime »