字符编码是从原始位(0和1)到文本字符的映射集。用其他编码器解码使用特定编码器编码的文本时,它将更改输出文本。有时这会导致完全不可读的文本。该数据集旨在提供不同字符编码的示例文本列表,以帮助您诊断源文件实际位于哪个文件中。 die_ISO-8859-1.txt file_guide.csv harpers_ASCII.txt olaf_Windows-1251.txt portugal_ISO-8859-1.txt shisei_UTF-8.txt yan_BIG-5.txt