Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Safety Filters

Safety Filters

behavior

Built-in constraints that prevent a model from generating harmful, offensive, or inappropriate content in its responses.

Safety Filters — Glossary — ThinkLLM