Python编写的简单程序,共有130多行代码,用于基于LSTM的命名实体识别实验。在数据处理过程中,对每个实体类型进行编号,并给每个单词进行编号和文本填充。使用标识符,将所有序列处理成相同长度。在训练流程中,为每个输入和其对应的编号建立一个张量,并构建训练批次。输入到LSTM单元,再输入到全连接层,使用softmax或其他分类器进行预测。可以使用pytorch自带的LSTM类、其他工具或自己编码来构建模型。