暗黑破坏神该项目适用于乔治亚理工学院的CS 6601人工智能课程。该项目对推文进行释义检测,即找出两条推文在给定推文含义上是否相似。我们实现了一种滑动窗口方法,通过神经语言模型学习词嵌入向量,对其进行归一化处理,随后运行动态池化以获得相同大小的相似矩阵。然后我们将其展平,并添加其他特征,如句子长度、占位符词频(标点符号、数字)和通用命名实体术语,最终获得一个特征向量。我们将其传递给Logistic回归分类器,并训练它从我们的训练集中识别相似和不相似的句子。我们达到了63.8%的af测量分数。

关于如何运行的说明:

  • 要运行非规范化:将run.sh中的第2行和第3行改为input.txt,然后运行sh run.sh,接着执行python simMat.pypython 分类Tweets.py

  • 运行规范化:检查normalizedInput.txt是否存在。