Name: Pisama
Author: Pisama

Question 1

What is grounding failure in AI agent systems?

Accepted Answer

Detects when output contains claims not supported by source documents. Agents achieve less than 45% accuracy on document-grounded tasks (OfficeQA benchmark).

Question 2

How does Pisama detect grounding failure?

Accepted Answer

Numerical Verification: Cross-checks extracted numbers against source values (5% tolerance) Entity Attribution: Verifies data points are attributed to correct entities Ungrounded Claims: Identifies claims with no source evidence Source Coverage: Checks that output claims map to actual source content

Question 3

How accurate is the grounding failure detector?

Accepted Answer

F1 0.671, precision 0.636, recall 0.710 on the Pisama calibration set.

Grounding Failure

Examples

Detection methods

Calibration accuracy