ID CNN CWS:源代码和论文“用于中文分词的迭代扩张卷积”的语料库源码

qqnegotiable13450 7 0 ZIP 2021-02-18 03:02:28

ID-CNN-CWS 源代码和论文“用于中文分词的迭代膨胀卷积”的论文集。它为CWS实现以下4种模型: 双LSTM 双LSTM-CRF 身份识别 ID-CNN-CRF 依存关系 Python> = 3.6 TensorFlow> = 1.2 同时支持CPU和GPU。 GPU训练速度提高了10倍。制备运行以下脚本以将语料库转换为TensorFlow数据集。 $ ./scripts/make.sh 训练与测试快速开始 $ ./scripts/run.sh $dataset $model $dataset可以是pku , msr , asSC或cityuSC 。 $mode

文件列表

ID-CNN-CWS-master.zip (预估有个41文件)

ID-CNN-CWS-master

convert_corpus.py 10KB

.gitignore 1KB

bilstm_char.py 4KB

README.md 1KB

tsv_to_tfrecords.py 13KB

cnn.py 15KB

eval_f1.py 3KB

radical.py 1KB

train.py 32KB

LICENSE 34KB

bilstm.py 9KB

utils.py 16KB

score 7KB

data_utils.py 9KB

scripts

train.sh 1KB

msr-cnn.sh 793B

asSC-cnn.sh 791B

run.sh 181B

make-x.sh 2KB

test.sh 270B

cityuSC-cnn.sh 795B

asSC-bilstm.sh 798B

common.sh 866B

make.sh 139B

cityuSC-bilstm.sh 798B

pku-cnn.sh 794B

pku-bilstm.sh 798B

msr-bilstm.sh 798B

tf_utils.py 6KB

official_scorer.py 3KB

data

radical

radical.txt 2.43MB

embeddings

character.vec 9.93MB

bakeoff2005

asSC_training.utf8 29.14MB

msr_test_gold.utf8 745KB

cityuSC_training.utf8 8.11MB

msr_training.utf8 16.03MB

asSC_test_gold.utf8 695KB

pku_training.utf8 7.35MB

cityuSC_test_gold.utf8 234KB

pku_test_gold.utf8 700KB

cnn_char.py 3KB

用户评论

暂无评论

CASIA汉语情感语料库

资源名称 CASIA汉语情感语料库共包括四个专业发音人，六种情绪，共9,600句不同发音，包括300句相同文本和100句不同文本，可供各种分析实验使用本数据集包含部分数据用途为研究情感语音所设

96 2018-12-09
抓取北大语料库词频

通过抓取北大语料库网页，获取词频数据，用的是asp代码，XMLHTTP

66 2018-12-20
语料库检索软件WordSmith

语料库检索软件WordSmith的详细使用说明，供大家参考哟！

42 2019-05-15
搜狐新闻分类语料库

搜狐新闻分类语料库，主要包含0汽车1财经2IT3健康4体育5旅游6教育7招聘8文化9军事十个分类，共50多万条记录

47 2019-05-17
COCA美国当代语料库

COCA美国当代语料库，美国人日常生活中所有接触的文字信息处理后提取出来的最高使用频率的单词表。

42 2019-05-19
AntConc语料库检索软件

使用简单，功能很全。ntConc是一款跨平台（即Windows、Linux与苹果电脑都有对应版本）的语料库分析统计软件，由日本学者LaurenceAnthony博士从2002年研发至今，历时13年的历

21 2019-05-21
语料库标注工具SUTDAnnotator

语料库标注工具SUTDAnnotator，研究自然语言处理的同学推荐使用。

41 2019-05-14
汉语语料库加工规范

《现代汉语语料库加工规范——词语切分与词性标注》词性标记

42 2019-07-28
酒店领域评语语料库

用于情感分析案例的语料库，亲测有效。积极、消极各5000条数据。

23 2019-07-10
TFIDF java实现语料库

TFIDF java实现可运行多文件语料库亲测可行语料库为《人民日报》相关权威新闻

34 2018-12-17

ID CNN CWS:源代码和论文“用于中文分词的迭代扩张卷积”的语料库 源码

文件列表

用户评论

推荐下载

ID CNN CWS:源代码和论文“用于中文分词的迭代扩张卷积”的语料库源码