ChatGPT利用模型压缩技术来缩小模型规模,方法包括:知识蒸馏、修剪和量化。