论文研究基于SNM算法的大数据量中文地址清洗方法.pdf

qq_31102354 11 0 PDF 2020-07-24 11:07:09

中文地址由行政区划地址和详细地址两部分组成，行政区划地址的处理可通过构建地址词典、分词、补充特征字等方式清洗，目前技术较为成熟。详细地址则随我国城镇化的发展而不断变化，且新的地址层出不穷，导致其清洗和规范化工作极其困难。在研究大数据量中文地址的基础上，提出了中文地址清洗模型，在行政区划地址先清洗并规范的前提下，对地址进行排序，利用SNM算法将详细地址聚集在一个较小的窗口内，对窗口内的地址进行匹配和清洗，实验结果证明清洗效果良好。

资源预览

用户评论

暂无评论

数据清洗的方法研究

数据清洗(DataCleaning，DataCleansing或者DataScrubbing)的目的是检测数据中存在的错误和不一致，剔除或者改正它们，以提高数据的质量

30 2019-05-14
论文研究基于扩展树状知识库的海量数据清洗算法.pdf

语音信号是一种典型的非平稳信号，其特性及表征本质特征的参数均是随时间变化的，而时频分析是分析时变谱的有力工具，Hilbert-Huang变换是一种新型的具有自适应性的时频分析方法，对于非线性、非平稳信

46 2020-01-01
浅析大数据量高并发的数据库优化

高并发数据库可以同时处理海量信息,应用范围很广。今天我们将讨论的是大数据量高并发的数据库优化,希望对大家有所帮助。如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而

13 2021-02-01
大数据量高并发的数据库优化详解

主要介绍了大数据量高并发的数据库优化,需要的朋友可以参考下

13 2020-11-26
大数据量高并发的数据库优化总结

大数据量高并发的数据库优化总结,总结了好多我们平常开发容易忽略的性能问题.值得一看!

22 2019-05-13
大数据量加高并发的数据库SQL优化

大数据量+高并发的数据库SQL优化

43 2018-12-17
大数据量下的Apriori改进算法及在weka平台的实现

对于数据库中数据量较大的情况，Apriori算法在搜索频繁项集和挖掘强关联规则的过程中，会导致算法扫描数据库和挖掘频繁项集过程中系统IO压力过大，算法性能较低等不足。文章提出了一种改进的快速Aprio

18 2019-08-02
C#方法高效合并多个Excel表格适用大数据量

这个项目是用vs提供的Excel接口来完成多个Excel的合并。优点是合并速度快，尤其是对于几万条的大数据量来说！

16 2019-05-13
大数据量遥感影像的分条带镶嵌策略

在个人计算机条件下,海量遥感图像的镶嵌是一个难题。该文从计算机软件和硬件等多个方面,对问题进行深入分析,提出分条带镶嵌的策略,解决了海量遥感图像镶嵌难题。设计并实现软件系统,该软件在遥感图像处理工作中

14 2020-09-21
大数据量翻页查询的一点经验

我的系统为:每天新增一张表,每张表的数据量为1000万条记。一共有十个字段,有四个字段需要排序,每个字段都可能出现在查询条件中,每次查询所有的字段必须都查询出来,可以查询三天之内的数据,没有和其他表的

8 2020-09-21

论文研究 基于SNM算法的大数据量中文地址清洗方法.pdf

资源预览

用户评论

推荐下载

论文研究基于SNM算法的大数据量中文地址清洗方法.pdf