RL-STPA: Adapting System-Theoretic Hazard Analysis for Safety-Critical Reinforcement Learning

Steven A. Senczyszyn, Timothy C. Havens, Nathaniel Rice, Jason E. Summers, Benjamin D. Werner et al.|April 16, 2026arXiv

Key Takeaway

RL-STPA provides a practical toolkit for systematically finding safety hazards in RL systems before deployment, even when formal verification is impossible—by combining domain expertise, targeted testing, and iterative safety improvements through training.

Summary

This paper adapts System-Theoretic Process Analysis (STPA), a safety engineering method, to evaluate reinforcement learning systems in safety-critical applications like autonomous drones.

safety evaluation reasoning

Key Terms

safety-critical-systems distributional-shift hazard-analysis curriculum-design coverage-guided-testing