4.7 数据入库
本部分描述将美国当代英语语料库COCA词频20000高频词数据导入数据库的过程。
4.7.1 功能
将项目前期所有环节的处理结果写入数据库。
4.7.2 操作人员
本次操作主要由地籍科负责土地登记数据维护的人员完成。
4.7.3 操作流程
- 导出项目: 点击“项目管理”菜单下的“导出项目”按钮,在弹出的窗口中选择操作人员和活动类型,点击“确定”。 ...(此处省略后续步骤,建议补充完整)
本部分描述将美国当代英语语料库COCA词频20000高频词数据导入数据库的过程。
将项目前期所有环节的处理结果写入数据库。
本次操作主要由地籍科负责土地登记数据维护的人员完成。
15000多篇腾讯新闻,涵盖各个方面,比较全面
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
中型语料库,对于一些文本分类问题较适用,语料库中已分好类,而且类中文章均为.txt文档
语音识别经典语料库TIMIT语料库的官方说明,包含语料构成
图灵机器机器人
最近在学Python自然语言处理,要用到nltk这个库的各种内置语料库,然而我nltk.download()的时候下载不了,浪费了很多时间。特意分享给大家~
小黄鸡语料库,简单的人工智能开发,很实用。
A freeware corpus analysis toolkit for concordancing and text analysis. Provided by Laurence Anthony
语料库检索工具,检索语料库
为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1.Chn
暂无评论