Sentiment4SE:基于机器学习的软件工程数据集情感分析工具 源码
情感4SE 基于机器学习的软件工程数据集情感分析工具 在这项研究工作中,我们研究了针对软件工程数据集的不同情感分析工具的性能。 我们特别关注新开发的基于深度学习的工具(例如(BERT4SentiSE,SEntiMoji,RNN4SentiSE))的性能。 基准数据集 在本研究中,我们使用了来自GitHub,Jira,Stack Overflow的三个基准跨平台数据集。 我们的原始和处理后的数据集可以在/ cross_platform / dataset /文件夹中找到。 文件“ cross_platform / dataset / processed / combined.csv”包含组合的数据集,这些数据集由以下基于深度和浅层机器学习的情绪分析工具使用。 “ combined.csv”包含使用Scikit-learn进行的10倍分层抽样。 此10倍采样用于报告平台内设置中回显工具的性能
文件列表
Sentiment4SE:基于机器学习的软件工程数据集情感分析工具
(预估有个312文件)
train3098itemPOLARITY.csv
556KB
datasetsenti4sdso.csv
731KB
ortujira.csv
528KB
github.csv
843KB
train3098itemPOLARITY.csv
556KB
combined.csv
2.47MB
Ortu_all.csv
632KB
github_gold.csv
955KB
jira.csv
660KB
so.csv
875KB
暂无评论