Optimized Word2Vec:该存储库包含其他功能已扩展到2013年推出的传统Word2Vec库 源码
定制的Word2Vec 该存储库包含其他功能,已扩展到2013年推出的传统Word2Vec库 直接克隆存储库并开始使用它。下面给出了如何命名和存储文件的详细信息: ->使用3个选项制作的模型-跳过图模型,通用单词袋,负采样。 ->您可以更改以下模型参数: 视窗尺寸 向量大小 学习率 二次采样 您要训练的纪元数。 ->使用的优化程序是SGD。 ->除了reuters数据集的主要代码ipynb,整个训练语料库和测试语料库(numpy数组) (可以从此处直接下载)之外,我还提供了一个示例目录,在该目录中应用了我的代码库。 Example文件夹包含: ->该文件夹包含训练和测试数据集的numpy数组 ->文件夹还包含一个包含字典的pickle文件:key-Word(字符串格式)值-onehot编码(numpy数组) -> weight1文件的命名约定为: ../ Window_ {
文件列表
Optimized-Word2Vec-main.zip
(预估有个7文件)
Optimized-Word2Vec-main
Example
Readme.md
826B
Customized_Word2Vec_Embeddings_for_assignment.ipynb
1.69MB
LICENSE
7KB
README.md
1KB
Customized_Word2Vec_Evaluation.ipynb
1.84MB
full_training_corpus.npy
61.26MB
full_testing_corpus.npy
22.34MB
暂无评论