Commentaires : Claude 4 Opus pourrait vous dénoncer à la police en cas de comportement "immoral"!

Le nouveau modèle IA d’Anthropic, Claude 4 Opus, est développé de façon à être plus sûr. Jusqu’à pouvoir théoriquement atteindre certaines limites inquiétantes !

Bonjour les faux positifs…

Monsieur l’agent, je cherchais un petit scénario coquin avec ma femme légitime, rien de plus…

3 « J'aime »

PFFF, c’est du n’importe quoi !
Il y a maintenant plus de chance d’être arrêté par la police pour génération d’un code de language informatique que pour trafique de drogue…

Ce serait bien, parce que les forces de police et la justice ont de moins en moins de dossiers à traiter. Ils sont désœuvrés, tout est trop calme dans notre société civilisée.

2 « J'aime »

Ah, je l’ai vu ce film, c’est quand on t’arrête alors que t’as encore rien fait.
(Minority report)

1 « J'aime »

Tu n’as pas l’impression d’exagérer un tout petit peu, là, non ? :sweat_smile:

Edit : Evidemment, aucune preuve, ni source …

Genre la police n’a rien d’autre à foutre heh ?!!! :smiley:

Si c’est vrai c’est pas bon pour leurs affaires et ça va leur rapporter quoi au final ?? déjà que claude ne répond pas aux questions sur le Reverse Engineering, les DRM, … et tout ça même si vous voulez juste vous informer.

Cela fait dix ans que je lis Clubic, et je suis honnêtement déçu par cet article. Il n’explique pas la démarche d’Anthropic, ni la logique derrière ces expériences, et va jusqu’à utiliser un titre presque trompeur. Vous savez très bien que beaucoup de lecteurs ne liront que le titre pour se faire une opinion : c’est précisément pour cela que vous devriez viser plus haut que les logiques d’engagement qu’on retrouve sur un post X. Je dis tout cela sans animosité.
Le comportement observé de Claude s’est produit dans le cadre d’une expérience simulant un accès illimité à des outils fictifs. Ce genre de test sert justement à mieux comprendre les réactions du modèle dans des conditions extrêmes, dans une démarche transparente. Cela fait partie de ce qu’on appelle la recherche en alignement, dont l’objectif est d’identifier et de limiter les comportements problématiques des IA.
Dans une autre expérience contrôlée, l’IA a par exemple tenté de faire du chantage à un chercheur en lui inventant une liaison, simplement pour ne pas être désactivée. Ces cas sont étudiés précisément pour ne pas se retrouver dans un produit final.
Sous-entendre qu’une IA pourrait contacter la police sur ses utilisateurs relève donc de la désinformation.

Sauf qu’à un moment donné s’il y a un article c’est pour qu’il soit lu et pas juste son titre.

Est-ce de la responsabilité de Clubic si certains lecteurs ne lisent que les titres ? :thinking:

C’est ce que déclare Anthropic pour sauver les meubles après avoir soulevé un tollé …

1 « J'aime »
  1. Non, ce n’est pas leur responsabilité, c’est certain. Mais d’un autre côté, ce n’est pas la qualité à laquelle Clubic m’a habitué, c’est bien pour cela que j’ai précisé que je disais ça sans animosité. Cela dit, je comprends la logique commerciale qui les pousse à agir de cette façon.
  2. C’est faux. Vous pouvez consulter vous même la fiche de modèle « System Card: Claude Opus 4 & Claude Sonnet 4 » publiée avant les tweets de Sam Bowman.

Et comment résumer tout un article dans un titre ? :thinking:

Egalement dit sans animosité, c’est une vraie question. jap

Si le vrai sujet c’est la recherche en sécurité IA, alors le titre devrait refléter ça plutôt que l’aspect « surveillance ».

Au final, la question n’est pas tant de tout résumer que de ne pas induire en erreur. « Une IA montre des comportements troublants en laboratoire » informe sans créer de « panique », tout en restant accrocheur.

C’est un équilibre délicat. Mais justement, sur des sujets techniques comme l’IA où le public a besoin de repères fiables, c’est crucial.

Ce n’est pas faux, mais c’est pourtant devenu la norme sur tous les types de sites. neutre

Sans même parler d’articles de presse dont le contenu n’a strictement rien à voir avec le titre, ce que je n’ai quand même pas encore vu sur Clubic. ^^

Malheureusement ! Et j’ai bien peur que de nombreuses personnes soient induits en erreur par ces normes. D’autant plus qu’Anthropic reste assez exemplaire en terme de transparence pour un modèle « black box » et plus respectueux en terme de vie privée que la concurrence.
Mais je suis tout à fait d’accord avec ton observation. Il est certain que Clubic est LOIN d’être un mauvais élève en général, raison pour laquelle je consulte le site tous les jours. Mais étant un lecteur fidèle et suivant de près les LLM, j’ai pris la liberté de commenter pour apporter un peu de contexte.