SQuAD:建立斯坦福问答数据集的质量检查系统源码

corporate68819 11 0 ZIP 2021-04-06 23:04:57

队为斯坦福问答数据集建立质量保证体系( ) 请阅读此博客以获取详细信息: : 第一个文件create_emb.ipynb负责为训练数据集的Wikipedia文章中的所有句子和问题创建一个嵌入句子的字典。第二个文件unsupervised.ipynb使用句子嵌入来计算句子和问题之间的距离,基于欧几里得和余弦相似度。最后,它从距问题最短距离的每个段落中提取设置。目前,它们的准确度分别为45%和63%。最后一个文件将此问题视为监督学习问题,其中我拟合多项逻辑回归,随机森林和xgboost并创建20个特征-(2个特征代表一个句子的余弦距离和欧几里得。我将每个段落限制为10个句子)。目标变量是具有正确答案的句子ID。所以我有10个标签。目前,这分别提供了63%,65%和69%的准确性。未来工作:使用RNN获得确切答案

文件列表

SQuAD-master.zip (预估有个27文件)

SQuAD-master

models.py 32KB

data

dev-v1.1.json 4.63MB

train-v1.1.json 28.89MB

create_emb.ipynb 599KB

unsupervised.ipynb 54KB

InferSent

models.py 32KB

__pycache__

models.cpython-36.pyc 22KB

train_nli.py 11KB

LICENSE 19KB

.DS_Store 10KB

dataset

tokenizer.sed 2KB

.DS_Store 8KB

get_data.bash 2KB

.gitignore 83B

.ipynb_checkpoints

Untitled-checkpoint.ipynb 377KB

create_emb-checkpoint.ipynb 249KB

README.md 6KB

encoder

models.py 9KB

evaluate_model.py 2KB

xutils.py 175B

samples.txt 567KB

demo.ipynb 46KB

README.md 179B

mutils.py 2KB

data.py 3KB

README.md 1KB

supervised.ipynb 87KB

用户评论

暂无评论

医疗问答数据爬取

Medical question and answer data crawling

29 2019-06-23
斯坦福数据治理成熟度模型

在做数据治理之前，建议先根据成熟度模型来做一个自我评估，这样有助于找到数据治理的具体的方向，避免眉毛胡子一把抓，没有重点，做了半天，不出成绩。数据治理应该从业务出发，最终回到业务。

12 2020-07-30
IDEA代码规范质量检查的实现

主要介绍了IDEA代码规范&质量检查的实现,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

8 2020-12-25
drupal qa只读Drupal的质量检查工具源码

Drupal质量检查一组模块,库和配置,可帮助确保Drupal的质量。可用命令 composer drupalqa:phpcs:config-install install-为Drupal项目安装

11 2021-02-01
维基百科百科问答数据集

该文件包含了维基百科的百科问答中的数据,问题和对应的答案都有,保存为Json格式,适合用于机器学习算法的训练和测试等工作。

27 2020-08-20
代码质量检查RecessTwitter.zip

Recess 是一个简单的建立在动态样式语言 LESS 上的代码质量检查工具。它能够直接作为一个编译器被集成到构建系统中，并使你的代码看起来更加整洁和易于管理。标签：Recess

22 2020-07-18
斯坦福的程序设计竞赛课程

斯坦福的程序设计竞赛课程,对常用算法讲解的很透彻,提供的例子很经典

6 2021-01-05
斯坦福glove预训练的词向量

预先训练的单词向量。维基百科2014 + Gigaword 5(6B令牌,400K词汇,无章,50d,100d,200d和300d载体):glove.6B.zip

145 2020-11-28
无线通信斯坦福的Goldsmith大作

斯坦福大学的Goldsmith无线通信，+北邮杨鸿文等译+中文版

84 2019-02-18
斯坦福paul iOS7的代码

斯坦福pauliOS7的全部代码,你绝对值得拥有！老头的代码可是很好的哦

45 2019-07-30

SQuAD:建立斯坦福问答数据集的质量检查系统 源码

文件列表

用户评论

推荐下载

SQuAD:建立斯坦福问答数据集的质量检查系统源码