Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Rollout Scoring

Rollout Scoring

techniques

Evaluating agent executions to provide feedback signals for skill improvement, used to validate whether edits improve performance.

Rollout Scoring — Glossary — ThinkLLM