Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Inference Engine

Inference Engine

deployment

Software that runs a trained model to generate predictions or outputs; vllm is an optimized inference engine for large language models.

Learn more on Wikipedia

Inference Engine — Glossary — ThinkLLM