该数据集包括常用的英文单词,诸如beijing,shenzhen这种地名也包含在内,但是没有其他小一点的城市,内容相对更为精简,包含的专有名词并不偏,适合NLP中用于匹配相似单词等。