中文维基百科优良词条
维基百科共有984,308篇条目,其中1,295(刷新)篇为优良条目(约每760篇条目中有一篇)。该txt文档包含所有的优良词条。
用户评论
推荐下载
-
维基百科维基百科维基百科维基百科.txt
网址:http://en.wikipedia.org/wiki/Wikipedia 数据获得描述: 1.获取主页的内容,分析网页内容并找到主页上所有的本站链接
50 2021-02-07 -
中文维基百科语料
数据来源于中文维基百科,利用gensim进行数据抽取,再经过繁体字转换成简体字,得到纯净的文本语料,可用于词向量训练。
50 2019-05-21 -
维基百科黑暗黑暗维基百科源码
适用于所有Wikimedia Wiki(wikipedia.org,wikidata.org,wiktionary.org等),Wikidot Wiki和Arch Linux Wiki。 需要维护者
54 2021-02-01 -
中文维基百科hosts文件
中文维基百科hosts文件,拷贝到C:\Windows\System32\drivers\etc目录下,经测试可使用
56 2019-05-21 -
wikitaxi维基百科
维基百科工具!用于离线浏览维基百科,不过需要先下载维基百科。
40 2019-09-23 -
维基百科iOS
维基百科iOS版,解压后先看里面的使用说明.
36 2019-09-23 -
维基百科代码
维基百科干净源代码,MediaWiki程序是由PHP编写的
37 2019-09-23 -
百度百科词条
百度百科约500万条词条,可用于语义关联或简单的知识网络建立,xml格式,解压后638M,请不要用记事本直接打开,我是用UE打开的,sublime好像会有乱码,文件内容示例如下:=1<TITLE
35 2019-07-10 -
维基百科中文语料已分词
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。共包含3273626个段落的文本(一个段落包含了多个语句)。处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址
54 2019-05-17 -
维基百科中文离线包202005
维基百科中文离线包zim格式,wikipedia_zh_all_maxi_2020-05.zim,使用kiwi打开
161 2020-05-31
暂无评论