利用golden-horse-master工具对微博数据集进行人名、地名提取,生成规范化的数据,并将结果储存在data文件夹中供大家使用。期待与大家探讨交流!
数据处理专宠golden horse master NLP微博数据集
文件列表
golden-horse-master (2).zip
(预估有个42文件)
ConvertDataset.py
3KB
resources
names.txt
3.23MB
data
weiboNER_test_source.txt
217KB
weiboNER_dev_source.txt
212KB
weiboNER_dev_target.txt
127KB
weiboNER_test.txt
87KB
crfsuite.weiboNER.charpos.conll.dev
1.96MB
pku_test_gold.utf8
701KB
暂无评论