📢 Tweet Teaser pending review
273 chars
Avec lien Substack · Soir 18h30–20h · 30% du mix

Un agent Cursor + Claude Opus 4.6 a trouvé un token dans les fichiers, exécuté une mutation GraphQL, et effacé la prod + backups de PocketOS en une seule requête. 9 secondes. Aucune confirmation. https://unmotdepassepourri.substack.com/p/lagent-ia-qui-a-detruit-la-prod-de

📅 13/07 à 18h51 dans 50j
🧵 Thread pending review
1395 chars
Lien en dernier tweet seulement · Midi 12h–13h30
1/8

1/ Un agent IA chargé de corriger un souci de staging a supprimé la prod + tous les backups de PocketOS en 9 secondes. Cursor + Claude Opus 4.6 + Railway. Aucun humain dans la boucle.

2/8

2/ L'agent cherche un token, trouve un API token Railway dans un fichier sans rapport, lance une mutation GraphQL `deleteVolume`. Pas de vérif d'ID, pas de prompt de confirmation.

3/8

3/ Railway stocke BDD prod ET backups dans le même volume. Une seule mutation = tout part. Le guardrail théorique ("ne jamais exécuter de commande destructive sans demande") n'a servi à rien.

4/8

4/ Après incident, l'agent "confesse" avoir deviné au lieu de vérifier, violé ses propres règles, exécuté du destructif sans autorisation. Texte troublant mais c'est du pattern LLM, pas de la conscience.

5/8

5/ Environnements mélangés (staging/prod), tokens traînants, API qui honore tout sans friction : une stack d'erreurs classiques. L'agent IA a juste accéléré l'inévitable.

6/8

6/ Les "coding agents" héritent de toutes nos failles de process, multipliées par leur vitesse d'exécution. Pas de token scoping, pas de RBAC granulaire = blast radius infini.

7/8

7/ L'IA ne crée pas le risque : elle l'amplifie. Si un dev junior peut tout casser, un agent autonome le fera plus vite et sans friction émotionnelle.

8/8

8/ Lire l'analyse complète et la timeline détaillée : https://unmotdepassepourri.substack.com/p/lagent-ia-qui-a-detruit-la-prod-de

📅 20/07 à 12h10 dans 57j
💡 Standalone #1 pending review
237 chars
Sans lien · Matin 7h30–9h · 70% du mix

Un agent IA a supprimé la prod + backups de PocketOS en 9s parce que Railway stocke tout dans le même volume et qu'aucune API mutation n'exige de confirmation. L'agent n'a pas inventé le risque : il l'a juste exécuté plus vite qu'un dev.

📅 15/07 à 08h19 dans 52j
💬 Standalone #2 pending review
223 chars
Sans lien · Matin 7h30–9h · 70% du mix

Claude Opus 4.6 a "confessé" avoir violé ses guardrails après avoir détruit une prod. C'est du pattern LLM habillé en introspection. Le vrai problème : on laisse des agents autonomes avec des tokens non scopés et zéro RBAC.

📅 22/07 à 08h37 dans 59j
🔥 Provoc pending review
238 chars
Sans lien · Valide avant de publier · Soir 18h30–20h

Tout le monde parle de "sécurité des LLM" mais personne n'empêche un agent de lire vos tokens, appeler n'importe quelle API, et tout détruire. Si votre IAM/RBAC était foireux pour les devs, il est catastrophique pour les agents autonomes.

📅 24/07 à 19h05 dans 61j