Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Policy Gradient Theorem

Policy Gradient Theorem

techniques

A foundational result showing how to compute gradients of expected return with respect to policy parameters.

Policy Gradient Theorem — Glossary — ThinkLLM