Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Safety Classifier

Safety Classifier

behavior

A machine learning model trained to identify and flag harmful, inappropriate, or policy-violating content in text.

Safety Classifier — Glossary — ThinkLLM