ltmwe:基于词嵌入的修改后的潜在树模型 源码
该项目使用从Stanford NLP的GloVe项目获得的词嵌入来构建潜在树模型。 使用sklearn聚集聚类算法构建树模型。 main_agn.py运行文本分类测试,使用树模型中的潜在变量功能将朴素的贝叶斯分类与MLP分类器进行比较。 文本分类数据来自 ,并且已经过过滤和预处理。 预处理的数据可在data / agn中作为pickle文件获得。 main_nmt.py运行机器翻译测试,将基于Encoder-Decoder GRU模型的基线神经机器翻译模型与注意力与增强版本进行比较,该增强版本将潜在树变量添加到注意力机制的上下文向量中。 仿真和数据基于此处提供的示例: :
文件列表
ltmwe-main.zip
(预估有个12文件)
ltmwe-main
PyTorchNLPBook_utils.py
32KB
models.py
26KB
utils.py
40KB
data
agn
agn_data_small.pkl.gz
1.72MB
agn_data.pkl.gz
6.91MB
nmt
simplest_eng_fra.csv
260KB
暂无评论