GermanWordEmbeddings:获取和预处理德语语料库使用word2vec(gensim)训练模型并使用生成的测试集对其进行评估的工具包 源码
关于在英语语料库上进行词嵌入训练的研究很多。 该工具包通过在德语语料库上应用深度学习,以训练和评估德语模型。 有关项目,评估结果和的概述可在或直接在此存储库中找到。 该项目是根据发布的。 开始吧 确保已安装Python 3以及以下库: pip install gensim nltk matplotlib numpy scipy scikit-learn 现在,您可以下载并在您的Shell中执行它,以自动下载此工具包和相应的语料库文件并进行模型训练和评估。 请注意,这可能需要大量时间! 您也可以克隆此存储库,并使用我已经进行评估和可视化。 如果您只想查看不同Python脚本的工作方式,
文件列表
GermanWordEmbeddings-master.zip
(预估有个61文件)
GermanWordEmbeddings-master
.github
FUNDING.yml
82B
evaluation.py
14KB
src
doesntfit.txt
1KB
opposite.txt
382B
verbs.txt
4KB
nouns.txt
1KB
adjectives.txt
3KB
暂无评论