multihead siamese nets:基于文本语义相似性任务的多头注意力机制构建的暹罗神经网络的实现 源码
暹罗深度神经网络的语义相似性。 该存储库包含Tensorflow中的暹罗神经网络的实现,该实现基于3种不同的主要深度学习架构构建: 卷积神经网络 递归神经网络 多头注意力网络 创建该存储库的主要原因是将GitHub上主要基于CNN和RNN架构构建的Siamese神经网络的知名实现方案与基于Transformer模型最初由提出的基于多头注意力机制构建的Siamese神经网络进行比较,这论文。 。 支持的数据集 当前版本的管道支持使用3个数据集: :NEW_button: 对抗自然语言推论(ANLI)基准: , 安装 资料准备 为了下载数据,请执行以下命令(此过程可能需要一段时间,具体取
文件列表
multihead-siamese-nets-master.zip
(预估有个58文件)
multihead-siamese-nets-master
requirements
requirements-gpu.txt
112B
requirements-cpu.txt
108B
.gitattributes
93B
layers
convolution.py
2KB
recurrent.py
1KB
similarity.py
1KB
__init__.py
0B
暂无评论