ID CNN CWS:源代码和论文“用于中文分词的迭代扩张卷积”的语料库 源码
ID-CNN-CWS 源代码和论文“用于中文分词的迭代膨胀卷积”的论文集。 它为CWS实现以下4种模型: 双LSTM 双LSTM-CRF 身份识别 ID-CNN-CRF 依存关系 Python> = 3.6 TensorFlow> = 1.2 同时支持CPU和GPU。 GPU训练速度提高了10倍。 制备 运行以下脚本以将语料库转换为TensorFlow数据集。 $ ./scripts/make.sh 训练与测试 快速开始 $ ./scripts/run.sh $dataset $model $dataset可以是pku , msr , asSC或cityuSC 。 $mode
文件列表
ID-CNN-CWS-master.zip
(预估有个41文件)
ID-CNN-CWS-master
convert_corpus.py
10KB
.gitignore
1KB
bilstm_char.py
4KB
README.md
1KB
tsv_to_tfrecords.py
13KB
cnn.py
15KB
eval_f1.py
3KB
radical.py
1KB
train.py
32KB
暂无评论