Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Multi-armed bandit

Multi-armed bandit

techniques

A decision problem where an agent repeatedly chooses between options to maximize rewards while learning which is best.

Multi-armed bandit — Glossary — ThinkLLM