Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Reward-Confidence Covariance

Reward-Confidence Covariance

techniques

A measure of how reward quality and model confidence vary together, used to adjust training baselines.

Reward-Confidence Covariance — Glossary — ThinkLLM