Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Preference-based Reinforcement Learning

Preference-based Reinforcement Learning

techniques

Learning reward models from pairwise comparisons of behaviors instead of explicit reward signals.

Preference-based Reinforcement Learning — Glossary — ThinkLLM