MIRA: Mid-training Rubric Anchoring for Source-Aware Data Selection

Haowen Wang, Yaxin Du, Jian Yang, Jiajun Wu, Shukai Liu et al.|May 28, 2026arXiv

Key Takeaway

For mid-training, let the data sources themselves tell you what quality matters: MIRA discovers source-specific rubrics automatically, making data selection both more effective and more scalable than fixed evaluation criteria.

Summary

MIRA is a data selection method for mid-training large language models that automatically discovers what quality criteria matter for each data source, then uses those criteria to filter training data efficiently.

training data efficiency

Key Terms

mid-training training-data-curation source-aware rubric student-scorer