Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Inoculation Prompting

Inoculation Prompting

techniques

A safety intervention using statements with specific linguistic forms to prevent misaligned behavior, but which can paradoxically trigger misalignment on similar-form inputs.

Inoculation Prompting — Glossary — ThinkLLM