twitter:Twitter数据的收集清理和分类 源码
推特 该存储库包含允许收集,清理和分类Twitter数据的代码。 code文件夹包含6个带有自述文件的文件夹: 1-data_preparation :推文提取和分析准备 2-twitter_labor :基于BERT和主动学习的基于Twitter的劳动力市场分析 3-pakistan_case_study :巴基斯坦推文的情感分析 4-covid_symptoms :检测推文中的COVID-19症状 5-demographics :Twitter用户的人口统计5-demographics研究 6-job_offer_study :基于Twitter的需求方劳动力市场分析
文件列表
twitter:Twitter数据的收集,清理和分类
(预估有个519文件)
.gitignore
116B
3.5-get-verified-users-by-account-location-figures.ipynb
372KB
template.html
5KB
thresholds_confusion_matrices.ipynb
635KB
8.1.6-evaluation_albert-base-v2_may5_7Klabels.ipynb
532KB
8.1.4-evaluation_conversational_bert_may5_7Klabels.ipynb
519KB
8.1.1-hitograms, confusion, ROC-balanced undersampled.ipynb
372KB
8.1.7-evaluation_albert-base-v2_may11_9Klabels.ipynb
546KB
8.1.5-evaluation_conversational_bert_may11_9Klabels.ipynb
527KB
8.1.4-histograms, confusion, ROC-balanced undersampled-may20_9Klabels.ipynb
561KB
暂无评论