Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Policy Imitation

Policy Imitation

techniques

Training an agent to match a target policy by minimizing divergence (e.g., KL divergence) between predicted and target actions.

Policy Imitation — Glossary — ThinkLLM