Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Reinforcement Fine-Tuning

Reinforcement Fine-Tuning

techniques

Adapting a model using reinforcement learning signals from verifiable rewards during post-training.

Reinforcement Fine-Tuning — Glossary — ThinkLLM