文章目录文本预处理读入文本分词建立字典将词转化为索引语言模型读取数据集建立字符索引时序数据的采样随机采样相邻采样RNN从零实现RNN 文本预处理 读入文本 import collections import re def read_time_machine(): with open('/home/kesci/input/timemachine7163/timemachine.txt', 'r') as f: # strip():移除字符串头尾的空字符 # 将非小写英文字符构成的非空字符串用空格 lines = [re.sub('[^a-z