模型剪枝技术指南:Wanda与SparseGPT实现LLM压缩,减小模型尺寸60%,加速推理4倍 | SkillsMD