Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Off-Policy Actor-Critic

Off-Policy Actor-Critic

techniques

A reinforcement learning method where an agent learns from past experiences (not just current policy) using separate networks for action selection and value estimation.

Off-Policy Actor-Critic — Glossary — ThinkLLM