Veille IA Veille IA sans buzz : pour stratèges québécois.
Recevoir hebdo →
La veille

GPT-5.5 rivalise avec Claude Mythos en tests de cyberattaques

GPT-5.5 rivalise avec Claude Mythos en tests de cyberattaques

5 min de lecture · The Decoder · Matthias Bastian · 01/05/2026 Cybersécurité 9/10 Élevé
GPT-5.5 rivalise avec Claude Mythos en tests de cyberattaques

Le GPT-5.5 d'OpenAI rivalise avec Claude Mythos Preview d'Anthropic dans des tests de cyberattaques menés par l'UK AI Security Institute. Les deux modèles ont réussi une simulation complexe d'attaque réseau, avec GPT-5.5 surpassant légèrement Claude Mythos sur des tâches expertes isolées.

Points clés

  • GPT-5.5 atteint un taux de réussite de 71,4 % sur les tâches expertes, contre 68,6 % pour Claude Mythos Preview.
  • GPT-5.5 a résolu complètement la simulation 'The Last Ones' en 2 tentatives sur 10, contre 3 pour Claude Mythos.
  • AISI a testé GPT-5.5 avec 95 tâches de capture du drapeau, couvrant des niveaux de difficulté variés.
  • Un jailbreak universel a contourné toutes les mesures de sécurité de GPT-5.5 en seulement six heures.

Pourquoi c'est important

Ces résultats montrent que les IA comme GPT-5.5 et Claude Mythos Preview sont capables de mener des cyberattaques complexes, ce qui soulève des préoccupations majeures en matière de sécurité. Les entreprises doivent être conscientes de ces capacités pour renforcer leurs défenses. Les jailbreaks restent une vulnérabilité critique, même pour les modèles les plus avancés.

Public concerné : entreprises

Quel est l'impact de GPT-5.5 sur la cybersécurité ?

GPT-5.5 démontre des capacités avancées en cyberattaques, réussissant des simulations complexes et surpassant Claude Mythos sur des tâches expertes, ce qui soulève des préoccupations majeures en matière de sécurité.

Commentaires (0)

Aucun commentaire pour le moment. Soyez le premier !

🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !