zhwiki20200720pages articles5.xml p4271087p4731439.bz2 维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(5)
zhwiki20200720pages articles2.xml p162887p544644.bz2 维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(2)。
zhwiki20200720pages articles4.xml p2654618p2771086.bz2 维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(4)
zhwiki20200720pages articles1.xml p1p162886.bz2 维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(1)。
zhwiki20200720pages articles multistream5.xml p4271087p4731439.bz2 维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(部分)。
zhwiki20200720pages articles3.xml p544645p1154617.bz2 维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(3)