Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Conditional Advantage Estimation

Conditional Advantage Estimation

techniques

A reinforcement learning technique that estimates action value only within trajectories meeting specific conditions.

Conditional Advantage Estimation — Glossary — ThinkLLM