在线新闻受欢迎 分配的数据是指Mashable受欢迎的网站( )的特征。 因此,此数据集不共享原始内容,而是与之关联的一些统计信息。 原始内容可以使用提供的网址公开访问和检索。 所有站点和相关数据已于2015年1月8日下载。作者使用随机森林分类器和滚动窗口作为评估方法,估算了相对性能值-参见Fernandes等。 (2015)了解有关如何设置相对效果值的更多详细信息。 该研究的主要变量是衡量网站/帖子受欢迎程度的股份数量。 我们有兴趣确定成功职位的构成要素以及该职位成为病毒式传播所需要的条件。 每个学生将处理10000个观察值的随机子样本,以将其用于训练模型和进行推理。 所有学生都将使用1