Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Data-Parallel Training

Data-Parallel Training

techniques

Distributing training data across multiple GPUs that compute gradients independently then synchronize.

Data-Parallel Training — Glossary — ThinkLLM