Github Repo明星预测器 总览 这是一个github repo star预测器,它试图预测任何大于100个星星的github存储库中的星星。 它根据所有者/组织的状态和存储库上的活动(提交,分叉,注释,分支,更新率等)进行预测。 在我们从github apis获取的数据集上,已经成功测试了不同类型的模型(梯度提升,深度神经网络等)。 数据集 我们使用github REST api和GraphQL api来收集具有超过100个星级的存储库的数据。 数据位于数据集目录中。我们能够使用Digital Ocean的多个服务器更快地收集数据。 因此,我们感谢为学生使用服务器提供的免费积分。 有关