Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Differentiable Reward Model

Differentiable Reward Model

techniques

A reward function designed to be differentiable so gradients can flow through it during training.

Differentiable Reward Model — Glossary — ThinkLLM