定制的Word2Vec 该存储库包含其他功能,已扩展到2013年推出的传统Word2Vec库 直接克隆存储库并开始使用它。下面给出了如何命名和存储文件的详细信息: ->使用3个选项制作的模型-跳过图模型,通用单词袋,负采样。 ->您可以更改以下模型参数: 视窗尺寸 向量大小 学习率 二次采样 您要训练的纪元数。 ->使用的优化程序是SGD。 ->除了reuters数据集的主要代码ipynb,整个训练语料库和测试语料库(numpy数组) (可以从此处直接下载)之外,我还提供了一个示例目录,在该目录中应用了我的代码库。 Example文件夹包含: ->该文件夹包含训练和测试数据集的numpy数组 ->文件夹还包含一个包含字典的pickle文件:key-Word(字符串格式)值-onehot编码(numpy数组) -> weight1文件的命名约定为: ../ Window_ {