Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Inference Speed

Inference Speed

performance

How quickly a model can generate predictions or outputs after being given an input, measured in time per token or tokens per second.

Inference Speed — Glossary — ThinkLLM