Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Inference Efficiency

Inference Efficiency

performance

The ability of a model to generate outputs quickly and with low computational resource consumption during real-world use.

Inference Efficiency — Glossary — ThinkLLM