vi-anchorTexts项目:7.锚文本a štatistika k anchortextom。文档频率,收集频率。安装:克隆这个仓库运行 npm install
安装。用法:解析XML文件并创建Elasticsearch索引(myindex) node parseXML.js [fileName]
搜索锚 node search.js \"[anchor]\"
。统计数据文件统计信息:skwiki-20140906-pages-articles.xml
锚点总数:5806777 每页平均锚点:17.282 带有锚链接的页面:1024543 每个锚点的锚文本平均数:1.8189 每个锚点不同锚文本的平均数:1.6456。测试运行:npm test
作者:亚当Močkoř @ 2014。
vi anchorTexts
文件列表
vi-anchorTexts-master.zip
(预估有个10文件)
vi-anchorTexts-master
package.json
736B
data
sample_anchors_output_skwiki_latest_pages_articles.txt
148B
sample_anchors_skwiki_latest_pages_articles.xml
4KB
test
test.js
1KB
parseXML.js
820B
search.js
752B
.gitignore
604B
暂无评论