牵牛星 在上阅读我们的项目发现,然后尝试下面的演示 通过无监督学习评估源代码的相似性 您如何确定一段源代码呢? 如何在语料库中搜索要使用的源代码? Altair是Lab41在矢量空间中表示源代码及其相关功能的探索。 我们感兴趣的是为Python生成健壮的源代码嵌入,例如为书面文本创建单词嵌入。 您可以在Lab41 上了解我们对单词嵌入进行早期实验的源代码。 我们的源代码表示和相似度计算的主要用例是为编码人员提供有意义的代码建议。 我们认为类似的技术可能对代码安全性分析,代码作者身份和代码code窃检测很有用。 通过Docker进行Altair演示! 从GitHub下载包含200,000个Python脚本的Gensim Doc2Vec矢量的pickle文件 在此示例中,我们将下载的泡菜文件保存到〜/ models / 建造容器 docker build -f Dockerfile.