Missing Word Locator 基于机器学习的缺词定位方法

qqsilky21871 10 0 zip 2024-10-27 21:10:52

缺少词定位器介绍：这是一个使用Kaggle的Billion Word Imputation数据集的缺失词定位项目。我们最初希望完成整个十亿字估算挑战，但在预测句中单词位置及其内容的过程中遇到了计算资源和时间上的限制。因此，我们专注于句子中定位缺失词的问题。通过以下两种方法来实现：

平均感知器：利用棕色聚类对词进行聚类。这一方法在缺词定位中的准确率达到了50%左右。
马尔可夫链模型：使用长距离二元组并基于n-gram特征进行预测。这一方法的成功率在30%左右。

我们发现，平均感知器在定位缺失词方面的表现优于马尔可夫链模型，但随着数据规模的扩大，优化算法的需求更为迫切。

文件列表

missing_word_locator-master.zip (预估有个15文件)

missing_word_locator-master

.gitignore 23B

averaged_perceptron.py 5KB

run_averaged_perceptron.py 704B

ap_utils.py 4KB

smooth_ldb.py 3KB

averaged_perceptron2.py 7KB

xtest.py 1KB

ntest.py 1KB

ngram_smooth.py 3KB

README.md 844B

ngram_probs.py 2KB

test.py 2KB

README_LDB 2KB

ldb_prob_sum.py 3KB

ldb_probs.py 3KB

用户评论

暂无评论

开机提示NTLDR is missing解决方法

由于杀毒，不小心把系统盘C盘的下的NTLDR删除了。然后重新启动的时候，就提示：“NTLDRismissing,PressCTRL+ALT+DELtorestart”，无法正常开机启动。分析：NTLD

42 2019-05-28
基于深度学习的分拣机器人目标识别与定位_解修亮

基于深度学习的分拣机器人目标识别与定位_解修亮基于深度学习的分拣机器人目标识别与定位_解修亮基于深度学习的分拣机器人目标识别与定位_解修亮基于深度学习的分拣机器人目标识别与定位_解修亮基于深度学习的分

18 2020-07-16
基于深度学习的车牌定位和识别方法李祥鹏.caj

基于深度学习的车牌定位和识别方法李祥鹏.caj

5 2022-12-28
移动机器人视觉定位方法的研究

针对移动机器人的局部视觉定位问题进行了研究。首先通过移动机器人视觉定位与目标跟踪系统求出目标质心特征点的位置时间序列, 然后在分析二次成像法获取目标深度信息的缺陷的基础上, 提出了一种获取目标的空间位

8 2020-09-01
基于spark机器学习pdf

Packt Machine Learning with Spark 2nd.Edition8.pdf

22 2019-01-13
机器学习实战基于Python

机器学习实战：本书的前七章主要研究分类算法，第2 章讲述最简单的分类算法：匕近邻算法，它使用距离矩阵进行分类；第3 章引入了决策树，它比较直观，容易迎解，但是相对难于实现；第4 章将讨论如何使用概率论

38 2019-02-10
基于Python机器学习代码

非常实用的基于Python机器学习的各类算法代码，含训练集和测试集

21 2020-05-24
矿井救灾机器人自主定位方法研究

介绍了矿井救灾机器人自主定位系统的构成和基于航迹推算的自主定位方法,提出了改进的自主定位方法,即使用具备衰减指数因子的有限记忆卡尔曼方法,并以逐级滤波的方式融合多传感器信息。Matlab仿真结果表明,

22 2020-07-20
机器学习实践测试驱动的开发方法

Machine learning practice test-driven development method

27 2019-06-26
机器学习中的聚类分析方法详解

机器学习中的聚类分析方法是一种重要的数据挖掘技术，它主要用于将数据集中相似的数据分成不同的组。本文将深入剖析聚类分析的概念、类型、应用场景以及常用的聚类算法，例如K-means算法、层次聚类等。同时，

5 2023-04-25

Missing Word Locator 基于机器学习的缺词定位方法

文件列表

用户评论

推荐下载