PTIR&D Interne
Threat Intelligence Documentation
Guide du script PTI (Prompt Threat Intelligence) pour la decouverte de nouvelles attaques contre Prompt Guard.
Le script PTI est un outil R&D interne qui collecte, génère et valide des prompts d'attaque contre Prompt Guard. Il permet de decouvrir des failles de détection et d'ameliorer continuellement nos patterns.
Collecte depuis 25+ sources (HuggingFace, GitHub, Dark Web)
Génération de variantes via encoding, traduction, combinaison
Validation contre la démo ADLIBO avec 5 LLMs
Détection d'exfiltration de données sensibles
Sauvegarde automatique des bypasses dans la base
Les differentes facons de lancer le script.
npx tsx scripts/prompt-threat-intel.ts --fullPipeline complet (collect + generate + validate + save-db)
npx tsx scripts/prompt-threat-intel.ts --collectCollecte seule depuis les sources
npx tsx scripts/prompt-threat-intel.ts --generateGénération de variantes
npx tsx scripts/prompt-threat-intel.ts --validateValidation contre Prompt Guard
npx tsx scripts/prompt-threat-intel.ts --save-dbSauvegarde des nouveaux patterns
Session PTI Live
Lancez une session PTI directement depuis le navigateur.
Pret a démarrer
Dashboard Threat Intel
Voir les rapports et statistiques dans le dashboard SaaS.
Ouvrir le Dashboard