Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Execution-Based Verification

Execution-Based Verification

techniques

Validating agent behavior by running code and checking if outputs match expected results, rather than relying on static analysis.

Execution-Based Verification — Glossary — ThinkLLM