佐治亚理工学院AI课程项目

brood93148 3 0 zip 2024-08-23 02:08:51

暗黑破坏神该项目适用于乔治亚理工学院的CS 6601人工智能课程。该项目对推文进行释义检测，即找出两条推文在给定推文含义上是否相似。我们实现了一种滑动窗口方法，通过神经语言模型学习词嵌入向量，对其进行归一化处理，随后运行动态池化以获得相同大小的相似矩阵。然后我们将其展平，并添加其他特征，如句子长度、占位符词频（标点符号、数字）和通用命名实体术语，最终获得一个特征向量。我们将其传递给Logistic回归分类器，并训练它从我们的训练集中识别相似和不相似的句子。我们达到了63.8%的af测量分数。

关于如何运行的说明：

要运行非规范化：将run.sh中的第2行和第3行改为input.txt，然后运行sh run.sh，接着执行python simMat.py和python 分类Tweets.py。
运行规范化：检查normalizedInput.txt是否存在。

文件列表

Diablo-master.zip (预估有个36文件)

Diablo-master

train.data 5.58MB

baseSimMat.py 997B

emnlp_dict.txt 642KB

data

simMats15.pickle 44.18MB

sentences.txt 997KB

word-embeddings.pickle 26.43MB

word-embeddings.mat 5.26MB

labels.txt 22KB

tokenized_lines15.pickle 3.22MB

LRsimMats1.pickle 44.18MB

wikiVectors.pkl 26.05MB

simMats.pickle 26.49MB

simMat.py 2KB

input.txt 1020KB

normalizedInput.txt 1023KB

dp.py 2KB

tweetsToInput.py 644B

README.md 1KB

run.sh 153B

metrics.py 1KB

classifyTweets_normalized.py 4KB

dp.pyc 2KB

word2vec

word-embeddings.mat 5.26MB

sentences.data 1.11MB

generate_word_vectors.py 2KB

dict_dump.pickle 1.44MB

metrics.pyc 1KB

mat_files_for_input

sentences.txt 998KB

twitter_all.mat 2.37MB

input.txt 1020KB

labels.txt 23KB

txtToMat.py 631B

readme.txt 525B

report.pdf 109KB

classifyTweets.py 4KB

twitterNormalizer.py 1KB

用户评论

暂无评论

加州理工学院控制和动力系统讲稿

加州理工学院控制和动力系统讲稿 System Identification (ID): CDS 270 – I Project Notes

23 2020-10-08
计算理论导引中文美麻省理工学院

本书系统地介绍了计算理论的三个主要内容：自动化于语言，可计算性和计算复杂性。绝大部分内容是基本的，同时对可计算性和计算复杂性理论中的某些高级内容作了重点介绍。作者以清新的笔触，生动的语言给出了宽泛的科

27 2020-03-04
洛阳理工学院数据结构实验报告.doc

洛阳理工学院实验报告系部计算机与信息工程系班级学号姓名课程名称数据结构实验日期 2014.4.23 实验名称实验5图的遍历的实现成绩实验目的掌握图的邻接矩阵和邻接表两种存储结构

17 2020-12-12
厦门理工学院数据结构实验5.pdf

数据结构实验报告实验序号5 实验项目名称队列的操作学号姓名专业班实验地点实1#514 指导教师林仙丽实验时间 2013-12-26 一实验目的及要求 1. 熟悉队列的基本概念 2.

7 2020-12-12
洛阳理工学院数据结构试题2.doc

. PAGE 教育资料一判断每小题 1 分共 10 分 1数据的存储结构是数据的逻辑结构的存储映象不仅要存储数据元素的值还要存储元素之间的相互关系 2用顺序表来存储线性表时不需要另外开辟空间来保存

15 2020-12-12
麻省理工学院.算法导论.part4

麻省理工学院.算法导论Introduction.To.Algorithms.2nd.Edition-CHM格式Introduction.to.Algorithms.中文版－PDF格式Introduct

23 2019-09-26
南阳理工学院老师自己编写的C#教程

南阳理工学院老师自己编写的C#教程，用于初学者相当棒！

26 2019-09-18
麻省理工学院计算机数学教程

麻省理工学院的计算机数学教程,包括基本理论、证明、归纳等等，是不可多得的计算机数学教材

20 2019-09-18
麻省理工学院算法导论part2

算法导论英文原版应大家要求改为3分，以前下过的，只能说对不起了

20 2019-09-27
麻省理工学院算法导论电子书

麻省理工学院算法导论C语言电子书教程算法

15 2019-09-03

佐治亚理工学院AI课程项目

文件列表

用户评论

推荐下载