TorchTitan:PyTorch原生分布式大语言模型预训练平台,支持4D并行与H100 GPU加速 | SkillsMD