模型剪枝技术:Wanda与SparseGPT实现LLM压缩,减少60%模型大小,加速推理4倍 | SkillsMD