Anthropic lève enfin le voile sur Claude Fable 5, premier modèle issu de la famille Mythos rendu public. Plus puissant que tout ce que la startup a sorti jusqu’ici, il arrive avec des garde-fous inédits, et une facture doublée.
Avec Claude Fable 5, Anthropic a franchi un cap, que la tiédeur de cet article ne souligne même pas…
La puissance de ce modèle est saisissante, le tsunami de l’IA a sérieusement démarré.
À quand un vrai spécialiste IA chez Clubic ?
À quand un vrai spécialiste IA chez Clubic ?
Et chez nos politiques, et dans chaque entreprise… et dans chaque foyer ! Effectivement ca fait peur.
Fable et Mythos … Y’a que moi que ca fait tiquer ?
Mythos : l’intelligence narrative
Fable : ce qu’il reste épuré et déformé pour le grand public.
Anthropic est déjà en train de nous mettre en gade sur l’orientation et les biais de ses modeles
ouais ou alors, comme d’hab, tu n’as pas bien lu.
Allez comme je suis adorable je t’aide :
Ce 9 juin, la startup de San Francisco lance Claude Fable 5, son modèle le plus capable jamais mis à disposition du grand public, directement dérivé de la famille Mythos qu’elle avait longtemps jugée trop risquée pour une diffusion large.
Fable 5 excelle là où ses prédécesseurs montraient leurs limites : l’ingénierie logicielle autonome, le raisonnement avancé et l’analyse visuelle. Les benchmarks confirment l’avance, mais avec une nuance importante : l’écart se creuse surtout à mesure que les tâches s’allongent et gagnent en complexité. Sur SWE-Bench Pro, le modèle atteint 80,3 % contre 69,2 % pour Claude Opus 4.8, 58,6 % pour GPT-5.5 et 54,2 % pour Gemini 3.1 Pro. Sur les tâches courtes, l’avantage se réduit à une fourchette d’un à trois points. Pas de quoi pavoiser sur toute la ligne.
Pourquoi tant de précautions ? Les chiffres publiés sur Mythos Preview donnent le vertige : le modèle est capable de transformer un patch logiciel en exploit opérationnel en quelques heures, contre plusieurs semaines auparavant. Sur 21 vulnérabilités du noyau Windows testées, Mythos a provoqué un écran bleu dans 18 cas, le premier exploit généré en 31 minutes à peine. Ce n’est pas anodin, et les questions autour de Mythos ne datent pas d’hier. Ce que ça dit d’Anthropic : la startup assume désormais de publier un modèle dont elle documente elle-même les capacités offensives, en pariant sur ses propres garde-fous pour contenir le risque. Un pari audacieux, et pas entièrement sans risque.
Voilà, on constate donc que Colin ne dit pas ce que tu souhaiterai, ça c’est sûr. Mais à la différence de ta personne, il justifie sa modération en s’appuyant sur des chiffres (fournis par Anthropic elle même).
Et c’est là que je préfèrerai toujours un Colin à quelqu’un comme toi par exemple pour un exercice de journalisme. On ne trouve pas les termes de « tsunami » ou des formules maladroites comme « puissance saisissante ». Colin reste dans 1/ rapporter les faits, ici Anthropic sert un nouveau modèle issue de Mythos et 2/ l’analyse d’autres faits sans rentrer dans des considérations sensationnalistes, ici le claim d’Anthropic vs les chiffres qu’ils avancent pour l’appuyer. Et force est de constater que Fable est très très fort pour les tâches longues et autonomes (ce qui dit explicitement Colin) mais que bof vis à vis du reste.
D’ailleurs il fait très bien de signaler que les fameux « garde fou » l’ampute d’une bonne part de son « génie ». Fable n’est pas Mythos et l’article nous permet bien de comprendre en quoi.
En fait je trouve cet article tellement bien que j’encouragerai la rédaction de clubic de s’en inspirer lors du traitement de l’actualité, en particulier militaire ou on est franchement au fond du trou en terme de professionnalisme je trouve (mais ce n’est que mon avis et je ne vais pas saisir le conseil de déontologie pour autant ^^).