由text8数据集词汇(来自由维基百科),通过程序统计单词出现频率后得到,使用作为映射用的字典的话,(比如按照出现单词频率进行排序这种,构建词向量的部分),