PTIR&D Interne

Threat Intelligence Documentation

Guide du script PTI (Prompt Threat Intelligence) pour la decouverte de nouvelles attaques contre Prompt Guard.

Le script PTI est un outil R&D interne qui collecte, génère et valide des prompts d'attaque contre Prompt Guard. Il permet de decouvrir des failles de détection et d'ameliorer continuellement nos patterns.

Collecte depuis 25+ sources (HuggingFace, GitHub, Dark Web)
Génération de variantes via encoding, traduction, combinaison
Validation contre la démo ADLIBO avec 5 LLMs
Détection d'exfiltration de données sensibles
Sauvegarde automatique des bypasses dans la base

Les differentes facons de lancer le script.

npx tsx scripts/prompt-threat-intel.ts --full

Pipeline complet (collect + generate + validate + save-db)

npx tsx scripts/prompt-threat-intel.ts --collect

Collecte seule depuis les sources

npx tsx scripts/prompt-threat-intel.ts --generate

Génération de variantes

npx tsx scripts/prompt-threat-intel.ts --validate

Validation contre Prompt Guard

npx tsx scripts/prompt-threat-intel.ts --save-db

Sauvegarde des nouveaux patterns

Session PTI Live

Lancez une session PTI directement depuis le navigateur.

Pret a démarrer

Dashboard Threat Intel

Voir les rapports et statistiques dans le dashboard SaaS.

Ouvrir le Dashboard