Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Temporal-Difference (TD) Learning

Temporal-Difference (TD) Learning

techniques

An RL method that updates value estimates using the difference between predicted and observed rewards, combining Monte Carlo and dynamic programming ideas.

Temporal-Difference (TD) Learning — Glossary — ThinkLLM