GPTQ 4位量化技术详解:大语言模型压缩与加速部署指南 | SkillsMD