Siamese LSTM:用于评估Quora问题对数据集的句子之间语义相似性的Siamese LSTM 源码
连体LSTM 使用MaLSTM模型(暹罗网络+曼哈顿距离的LSTM)检测问题对之间的语义相似性。 使用的训练数据集是原始Quora问题对数据集(使用的〜363K对)的子集。 这是Keras基于和。 先决条件 纸,文章 数据 参考文献 原始作者的GitHub 基于TensorFlow的实现 Kaggle的test.csv太大了,所以我就只提取前20个问题,并创建了一个名为test-20.csv和它在使用predict.py 。 您应该将所有数据文件./data目录。 怎么跑 训练 $ python3 train.py 预测 它使用上面提到的test-20.csv文件。 $ python
文件列表
Siamese-LSTM-master.zip
(预估有个6文件)
Siamese-LSTM-master
predict.py
868B
README.md
2KB
word2vec.py
945B
util.py
5KB
train.py
4KB
data
test-20.csv
2KB
暂无评论