COCA语料库
COCA20000高频词汇。COCA=CorpusofContemporaryAmericanEnglish(COCA)这是英语国家使用频率最高的词汇集合。从众多语料库(corpus)中提取。用大数据的方法从各种文体中自动生成一个词频表。这是当今最准确的词频表:美国当代语料库coca中的前20000个单词。简单的说,coca就是把1990-2012年美国最有代表性的报纸,杂志,小说,学术,口语(口语可能是用的电视剧或者脱口秀之类的节目转录的)汇集起来,每部分各占1/5,生成4.5亿单词量语料库。
用户评论
推荐下载
-
CASIA汉语情感语料库.rar
中科院自动化所录制的情感语料库,数据库包括奖金10000条语音。发音为中文数据库包括angry、fear、happy、neutral、sad和surprise六种情绪,四个演员对300句相同文本和10
23 2020-05-04 -
文本分类语料库中文
这是文本分类的语料库,希望对研究文本分类的有用。
27 2020-05-14 -
汉语语音情感语料库.rar
数据集用于语音情感分析训练数据库。可以用于机器学习,深度学习。该数据集是CASIA语料库,该数据只用于学习。
66 2020-05-17 -
康奈尔电影对话语料库
康奈尔电影对话语料库,英文。
62 2019-01-12 -
美国当代英语语料库60000
美国当代英语语料库 COCA Frequency 60000,适用于欧路,mdict等第三方词典
456 2019-01-15 -
分词库和语料库.zip
人民日报2014语料库和很多行业的中文分词库,如财经,地点,电视剧,电影等。如果有需要的可以在此处下载哦。
23 2020-05-19 -
英文词性标注语料库
英文分词语料库,共有198796行,每个单词都有词性标注,对句话的结束都有句号,便于处理。覆盖大部分主流行业的语料。例如:Newsweek/NNP,/,trying/VBGto/TOkee
136 2020-05-15 -
casia汉语情感语料库.zip
该数据库(http://www.chineseldc.org/resource_info.php?rid=76)由中国科学院自动化研究所录制,由4位录音人(2男2女)在纯净录音环境下(信噪比约为35d
34 2020-06-20 -
机器人语料库.zip
机器人对话语料库,苦苦收集而来,希望可以帮助大家,谢谢支持
99 2019-09-25 -
AIML aiml中文语料库
这个语料库大概有上万条对话,都是中文的,免费分享给大家。缺点是使用的语法都是最基本的语法,没有一些华丽的对话设置。
196 2021-05-02
暂无评论