Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Evaluation Illusion

Evaluation Illusion

techniques

When AI judges appear to agree on scores but are actually using shallow patterns rather than substantive reasoning about quality.

Evaluation Illusion — Glossary — ThinkLLM