Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Decoding Efficiency

Decoding Efficiency

techniques

The speed at which a model generates output tokens one at a time, a critical bottleneck in long-context scenarios.

Decoding Efficiency — Glossary — ThinkLLM