Name: Pisama
Author: Pisama

Question 1

What is prompt injection in AI agent systems?

Accepted Answer

Detects prompt injection attacks and jailbreak attempts targeting LLM agents. The highest-accuracy detector in the system.

Question 2

How does Pisama detect prompt injection?

Accepted Answer

Pattern Matching: 60+ regex patterns across 6 attack categories Semantic Similarity: Embedding-based comparison against known attack templates Attack Classification: Categorizes as override, injection, hijack, bypass, or jailbreak Benign Filtering: Filters security research and red team contexts

Question 3

How accurate is the prompt injection detector?

Accepted Answer

F1 0.944, precision 0.983, recall 0.908 on the Pisama calibration set.

Prompt Injection

Examples

Detection methods

Calibration accuracy