Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Reinforcement Learning from Human Feedback

Reinforcement Learning from Human Feedback

training

A training technique where human evaluators rate model outputs, and the model learns to produce responses that humans prefer.

Learn more on Wikipedia

Reinforcement Learning from Human Feedback — Glossary — ThinkLLM