1. 以字母(Character)为基础的压缩 1. 文本解析:将cacm.all文件分解成一个个的字母 2. 字频统计:统计每个字母出现的词频 3. Huffman编码:根据Huffman编码的原理,对每个字母进行编码。给出一个编码字典。 4. 文档压缩:根据Huffman编码,压缩文件。 5. 文档还原:对压缩后的文档进行解压缩。