Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Inference Serving

Inference Serving

techniques

A system that hosts trained ML models and processes incoming prediction requests on deployed hardware like GPUs.

Inference Serving — Glossary — ThinkLLM