word1.3.1.jar中文分词 word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵
Hadoop2.4.0加Hbase0.94.18加Nutch2.3集中和分布式爬虫配置攻略.docx 使用github中最新的nutch-2.x源码,Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3配置攻略,在ubuntu14.04上成功运行本地和分布式爬虫。该文档详细描述了三者版本不兼容问题的解决方案以及各个配置文件的详细配置。
SolrJ6.3.0 放了SolrJ6.3.0所有web工程下的Jar包。solr-solrj6.3.0.jar等。放了SolrJ6.3.0所有web工程下的Jar包。放了SolrJ6.3.0所有web工程下的Jar包。
ZabbixServer3.4CentOS7自动安装脚本 zabbix(音同zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。本脚本包含ZabbixServer3.4CentOS7自动安装脚本(