Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Inference-Time Compute Scaling

Inference-Time Compute Scaling

techniques

Adjusting computational cost during inference by varying model behavior (e.g., loop counts) without retraining.

Inference-Time Compute Scaling — Glossary — ThinkLLM