Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Decoupled reinforcement learning

Decoupled reinforcement learning

techniques

Training separate reward objectives for different tasks (e.g., binary judgment vs. error localization) instead of optimizing them jointly.

Decoupled reinforcement learning — Glossary — ThinkLLM