Optimization Dynamics Imprint Semantic Specificity in Contrastive Embedding Norms

Ziwei Su, Junyu Ren, Victor Veitch|June 29, 2026arXiv

Key Takeaway

Embedding norms in contrastive models aren't wasted information—they automatically capture semantic properties during training and can be leveraged as free calibration signals without additional training.

Summary

This paper explains why embedding norms (magnitudes) in contrastive models encode semantic information like concept specificity, even though these models use scale-invariant losses that should ignore norms.

training evaluation

Key Terms

contrastive-learning embedding-magnitude scale-invariant-loss optimization-dynamics calibration