记忆学 模因-为什么如此受欢迎? 我在DataFest4上有关解析网站(包括KnowYourMeme)的研讨会演讲可以在找到。 该项目 包含对数据集的简短其中包含一些图形,统计数据等,当然还有文本分析和建模。 根据每天对模因的平均观看次数,我创建了5组“受欢迎程度”,从“非常不受欢迎”到“病毒性”。 为了处理描述文本,我使用了TF-IDF转换,然后将其传递给Logit回归和Random Forest。 总体而言,模型的质量非常令人满意,达到了0.43的准确度(天真常数为0.2)