Duplicate Question Pairs Identification:该存储库探索并实现了3个模型来处理Quora问题对这是NLP Text相似性子区
最近更新 尝试探索的使用。 Mmodel堆叠,TBC .. 更新 注意:此处显示了此项目的更新。但是报告中的模型结果将在2020年12月3日保持不变。 尝试使用句子BERT(Siamese BERT)来改进Model 3,这不比具有暹罗BiLSTM功能的BERT好。 2020.12.15 已尝试ESIM。 2020.12.15 有关重复问题对识别项目的文档 Author: YUAN Yan Zhe, yanzheyuan23@sina.com written on **DEC 3rd, 2020** Collaborators: WEN Ze @WENZe79, YU Jia Hui @YUJIAHUII 项目说明 在自然语言处理(NLP)领域中,文本相似性是一个热点。测量某些NLP子区域中的句子或短语之间的相似性尤其重要,例如对话系统和信息检索。 Quora Question P
文件列表
Duplicate-Question-Pairs-Identification-master.zip
(预估有个15文件)
Duplicate-Question-Pairs-Identification-master
data
train.csv.zip
20.8MB
dataset.md
256B
sample_submission.csv
21.31MB
model2
siamese_lstm_featured.ipynb
30KB
siamese_lstm.ipynb
34KB
siamese_lstm_featured-comparison.ipynb
50KB
siamese_bilstm.ipynb
26KB
暂无评论