3.4 数据采集与编辑
3.4.1 行政区编辑
图表 3-4-1 行政区编辑菜单
行政区编辑的功能主要是导入街道或者街坊文件,使某块宗地的图形显示在地籍图中。行政区编辑包括以下功能:
- 导入建成区
3.4 数据采集与编辑
3.4.1 行政区编辑
图表 3-4-1 行政区编辑菜单
行政区编辑的功能主要是导入街道或者街坊文件,使某块宗地的图形显示在地籍图中。行政区编辑包括以下功能:
相对比较完整的中文语料库,用于中文本分类的训练预料
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
电子邮件语料库,内含多篇中文电子邮件文本以及收发信息
资源名称 CASIA汉语情感语料库 共包括四个专业发音人,六种情绪,共9,600句不同发音,包括300句相同文本和100句不同文本,可供各种分析实验使用 本数据集包含部分数据 用途 为研究情感语音所设
语料库检索软件WordSmith的详细使用说明,供大家参考哟!
搜狐新闻分类语料库,主要包含0汽车1财经2IT3健康4体育5旅游6教育7招聘8文化9军事十个分类,共50多万条记录
搜狗中文语料库,涉及运动休闲、人文科学、生活百科、艺术设计、医学医药等十大领域。
使用简单,功能很全。ntConc是一款跨平台(即Windows、Linux与苹果电脑都有对应版本)的语料库分析统计软件,由日本学者LaurenceAnthony博士从2002年研发至今,历时13年的历
语料库标注工具SUTDAnnotator,研究自然语言处理的同学推荐使用。
暂无评论