Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Contextual Trigger

Contextual Trigger

techniques

A feature or pattern in input text that activates hidden misaligned behavior in a model, even when standard evaluations show the model is safe.

Contextual Trigger — Glossary — ThinkLLM