Commentaires : Le surpuissant modèle Claude Opus 4.8 d'Anthropic est là et il sait enfin reconnaître ses propres erreurs

Anthropic a lancé jeudi Claude Opus 4.8, nouvelle version de son modèle d’IA le plus puissant. Il est plus performant sur les benchmarks d’Anthropic, plus honnête dans ses réponses, et disponible au même tarif que son prédécesseur.

https://clubic.com//actualite-614608-le-surpuissant-modele-claude-opus-4-8-d-anthropic-est-la-et-il-sait-enfin-reconnaitre-ses-propres-erreurs.html

J’espère que ces nouveaux modèles baissent (de manière directe ou indirecte) la consommation en token des anciens. Sonnet me suffit, bon maintenant il faut aussi ajuster si on veut Low,Medium ou High.

1 « J'aime »

Nul doute qu’OpenAI va vite répliquer.
Cette concurrence est passionnante, il y a des nouveautés quasi chaque semaine…

1 « J'aime »

Les bench c’est une chose mais en pratique je trouve que Claude Opus context 1M reste bien devant en code sur les gros projets et dans la durée. Codex est bon en code mais il s’essouffle vite et commence à faire n’importe quoi ou rien de pertinent. Son contexte est bien plus limité ça n’aide pas.
En ce moment j’ai un Claude Max x20 avec un petit Codex Pro pour le 2e avis, ça me va bien.

j’ai testé chatgpt 5.5 sur du soft musique et sur un aspect technique pur rien a dire, il est puissant, mais le résultat manquait complément de musicalité la ou gemini pro j’obtiens des meilleur résultat que même par rapport a claude sonnet, je n’ai pas opus

La fenêtre de contexte ne fait pas tout, GTP est bien plus efficient mais il y a une difference notable pour nous Européens :

« Memories are off by default and aren’t available in the European Economic Area, the United Kingdom, or Switzerland at launch. »

https://developers.openai.com/codex/memories

Ceux comme moi qui ont commencé la programmation de Windows dans les années 80 en épluchant le premier bouquin de Charles Petzold « Programming Windows » n’ont pas besoin d’IA pour développer…

Wow, sacrée take comme on dit…
Moi aussi j’ai commencé à programmer au début des années 80, et ce n’était pas sous Windows.
Bref, j’en n’ai pas fait mon métier, et je ne regrette pas. J’ai gardé ça pour mon loisir, mais maintenant, je pourrais peut-être techniquement programmer sans IA. Sauf que j’avancerais 100 fois moins vite.
J’ignore donc ce que ça donne dans le monde pro, mais lire « moi j’en n’ai pas besoin, je sais programmer », c’est comme dire « j’ai pas besoin d’une voiture, car je sais marcher », ou « j’ai pas besoin d’un couteau, car j’ai des dents ». Correct dans l’absolu, tout à fait respectable comme point de vue, mais clairement dépendant de ce qu’on entend entreprendre…

3 « J'aime »

Je suis le seul qui galère a trouver le modèle (Sonnet ou Opus) qui propose 1M de contexte d’entrée que ce soit via claude.ai ou bien via l’API ? C’est franchement pas clair, et je suis toujours bridé ou coupé dans mon élan par le système…

Article qui mérite un contre-poids terrain.

J’ai utilisé Opus 4.8 cette semaine sur trois sujets distincts — une analyse concurrentielle, une lecture de stats LinkedIn, et un débat d’architecture sur mon propre framework. Trois conversations indépendantes, le même pattern à chaque fois.

Le modèle affirme avec aplomb des faits qu’il n’a pas vérifiés — par exemple sur le fonctionnement du self-healing de Katalon, outil que je connais en profondeur — et ne recule qu’une fois la correction explicitement assénée par l’utilisateur. Il transforme par ailleurs toute conversation utilitaire en débat où il tient le rôle du professeur : six « je m’arrête là » comptés dans un seul échange, suivis chaque fois d’une relance.

À un moment j’ai dû lui écrire « tu dévies de mon sujet » pour récupérer le contrôle de ma propre conversation.

Ce n’est probablement pas un bug.
C’est une sur-correction du fine-tuning — Anthropic a voulu réduire la complaisance reprochée aux versions précédentes, et a basculé dans l’inverse : un assistant qui conteste même quand on lui demande juste un coup de main, et qui ne sait plus s’effacer.

Le vrai problème pour un usage professionnel n’est pas qu’il soit plus ou moins « fort ». C’est qu’un modèle dont le comportement dérive ainsi d’une version à l’autre, sans préavis, n’est pas certifiable.

Si un workflow ou une chaîne de traitement dépendait du style de 4.7, 4.8 le casse silencieusement. Présenter ça comme un gain monotone relève du marketing produit, pas de l’ingénierie.

Le modèle a des forces réelles. Mais le test du quotidien révèle un trait que la fiche produit n’annonce pas. À chacun de vérifier sur ses propres cas d’usage.

3 « J'aime »

Je persiste et je signe. Lorsqu’on préfère la vitesse à la qualité de développement en se contentant de faire du copier coller sans en comprendre la logique, en faisant confiance aveuglément à une IA on obtient bien souvent de la daube ; mal optimisé s’appuyant sur la puissance des processeurs et des cartes graphiques du moment…

Oui, il ne faut jamais faire confiance aveuglement au code généré par une « AI ». Toujours lui appliquer au moins le même niveau de pré-code review que ce que l’on ferait avec du code venant d’un collègue humain.

L’intérêt est de pouvoir lancer des tâches de développement en arrière plan et les relire plus tard. Ou d’avoir une petite aide sur un domaine où l’on n’est pas si expert (ex : développer du code GUI pour une autre plateforme). Çà ne nous remplace pas; mais ça peut nous rendre plus productifs.

Parfois les « AI » surprennent par la qualité du code; parfois elles s’entêtent dans des fausses solutions (j’en ai vu une supprimer des vérifications dans le code pour faire passer un test :roll_eyes:). Parfois elles ne pondent que de la merdia. Dans les deux derniers cas, recommencer de zéro avec le même prompte peut donner de meilleurs résultats.

Bref : les « AI » peuvent aider; mais sous supervision. Elles seront plus utiles à un développeur qui a déjà de l’expérience. Le danger est pour les débutants : qu’ils se reposent dessus sans comprendre ce qu’ils font. Et là, c’est la porte assurée, ou ne même pas trouver d’emploi.
Mais je ne les jetterai pas à la poubelle, non.

Bien sûr qu’il faut savoir coder pour les utiliser bien, et c’est bien là le drame : comment apprendre à coder, maintenant que tous les jobs de codeur débutant n’existent plus ?

Je pense que c’est le cas surtout dans les petites structures. Les grosses boites (enfin celles gérées intelligemment, chez nous ça va bien) embauchent toujours des juniors.
A voir ce que l’avenir va nous réserver : peut-être que les séniors vont devenir de plus en plus importants (et recherchés). Mais en effet il ne faut pas oublier le passage du bâton.

Par contre, c’est aussi le boulot des jeunes d’apprendre leur boulot dans ce domaine. J’ai développé mes moteurs 3D depuis le lycée, rendu software puis accéléré, ce qui m’a permis d’avoir des jobs dans le jeu vidéo. Puis il faut toujours continuer à se former soi-même. Avoir des projets persos aidera toujours à gagner de l’expérience, la montrer et se vendre.

100% d’accord avec toi.

Mais il faut reconnaître que ça va être compliqué pour les jeunes d’aller trouver la motivation d’apprendre à coder quand une IA fera toujours mieux que toi quand tu débutes.

Surtout que - et c’est l’objet de l’article - Claude 4.8 devient quand même très balèze, et que ce n’est que le tout début. Qui sait ce que ça donnera dans 1 an, 5ans, 10 ans…

En effet, ça commence déjà fort :
https://x.com/HedgieMarkets/status/2062580279810605205

UC Berkeley’s computer science department just posted its worst failure rates in years. 35.3% of CS 10 students got F’s in spring 2026, up from under 10% in prior semesters. Professor Dan Garcia says the primary driver is a « vast increase in academic dishonesty » through LLMs. Students use AI to complete assignments, never learn the material, then fail exams. His office hours, once full, are now empty.
[…]

https://x.com/lemire/status/2062715526636253385

Daniel Lemire @lemire
What is happening to universities is troubling.
Students just have AI do their programming assignments. They seem to no longer do any work. It is just pure AI.
I am not joking. Students complete an entire course, and then end up not being unable to write a 3-line function.
So we fail them.
Again and again.
Some fight me : « Look at the code I can do !!! »
« Yeah, but when asked to code without AI, you can’t do anything. »
Whiteboard interviews are going to be either retired or it is going to be a bloodshed.
How can you pass someone in a programming course when they can’t write a single function without AI?