Celios Insights : Claude Code, cyberattaques autonomes : prouesse technique ou opération marketing ?

Anthropic affirme avoir déjoué une attaque menée avec son IA Claude Code, utilisée comme un “agent” capable d’automatiser 80 à 90 % d’une campagne de cyberespionnage.

Une annonce spectaculaire… mais presque trop parfaite.

CyberScoop et Ars Technica apportent une lecture beaucoup plus nuancée. Et les deux récits ne racontent pas la même histoire.

Ce que dit Anthropic

Dans sa publication sur son site, on peut comprendre :

  • Une opération “sophistiquée”, menée par un groupe lié à la Chine, avec Claude utilisé à chaque étape : repérage, scanning, exploitation, exfiltration.
  • L’IA aurait effectué la quasi-totalité du travail, l’humain n’intervenant que ponctuellement.
  • L’entreprise dramatise même : “si l’IA peut être détournée à ce point, faut-il continuer à la développer ?”
  • Pour conclure aussitôt : oui, car ces mêmes capacités la rendent indispensable en cyberdéfense.

Ci-dessous la présentation visuelle par Anthropic (dans son article) : “The diagram below shows the different phases of the attack, each of which required all three of the above developments:”

Message implicite : notre IA est redoutable, mais rassurez-vous, nous la maîtrisons.

Ce que disent CyberScoop et Ars Technica

D’autres lectures présentent une autre version, cette fois-ci plus nuancée sur cette maitrise globale :

  • Le rôle humain a été bien plus massif que ce qu’Anthropic laisse entendre : conception de l’orchestrateur, vérification des résultats, corrections des erreurs.
  • Le fameux “90 % d’autonomie” est très contesté, Claude ayant halluciné à plusieurs reprises.
  • Le rapport manque d’éléments techniques : aucun prompt, aucune trace exploitable, impossible de valider l’histoire.
  • Plusieurs chercheurs évoquent une narration gonflée destinée à mettre en avant la “surpuissance” de Claude, tout en positionnant Anthropic comme protecteur responsable.

Alors, avec cette lecture proposant des angles différentes, il est clair que l’IA peut accélérer et automatiser certaines phases d’une attaque ; et, découper les tâches peut contourner les garde-fous.

Mais… Le degré d’autonomie annoncé semble largement amplifié avec une intervention humaine qui reste centrale.
Le récit ressemble beaucoup à une communication destinée à impressionner autant qu’à informer.

IA sans humain : pas encore aujourd’hui !

Anthropic raconte une attaque presque autonome, digne d’un film, pour montrer à quel point Claude est puissant et indispensable.
Les analyses indépendantes montrent surtout une réalité plus banale : une attaque assistée par IA, oui… mais loin d’être automatisée à 90 %, et fortement encadrée par des humains.

Bref, une histoire calibrée pour faire peur, rassurer, et vendre, plutôt que pour décrire fidèlement les faits.

 


Thierry Decoux – DSI Celios
Novembre 2025

Celios Insights – Publications proposées par les équipes internes Celios sur un fait d’actualité, une veille, un regard technique ou d’usage.