Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software

Arastoo Zibaeirad, Marco Vieira|June 18, 2026arXiv

Key Takeaway

Fine-tuning LLMs for vulnerability detection produces calibration without comprehension: models adjust their confidence scores to match training data but don't develop actual security reasoning.

Summary

This paper evaluates whether LLMs actually understand software vulnerabilities or just memorize patterns. Using 834 carefully curated Linux kernel samples with strict temporal splits to prevent data leakage, the authors find that fine-tuning doesn't improve genuine security reasoning—it only adjusts output thresholds.

evaluation safety training

Key Terms

fine-tuning lora data-contamination memorization calibration