ag_news_csv.tgz 496,835条来自AG新闻语料库4大类别超过2000个新闻源的新闻文章,数据集仅仅援用了标题和描述字段。每个类别分别拥有30,000个训练样本及1900个测试样本。README:AG'sNewsTopicClassificationDatasetVersion3,Updated09/09/2015
MultiDomain Sentiment Datase英文情感分析数据正负情感semantic_data.zip Multi-DomainSentimentDataset解析成txt文件,只提取出文本和对应标签。positive和negative二分类。包括dvd,kitchen,books,electronics四个domain数据,每一个domain分别有positive和negative数据各1000条。
ag_news数据集 496,835条来自AG新闻语料库4大类别超过2000个新闻源的新闻文章,数据集仅仅援用了标题和描述字段。每个类别分别拥有30,000个训练样本及1900个测试样本。README:AG'sNewsTopicClassificationDatasetVersion3,Updated09/09/2015
来自于NLPCC2013解析成txt文件不均衡分类中文情感分析7类情感.zip 来自于NLPCC2013,解析后每一行为情感\t句子共有七类情感,且分布不均衡,划分训练集和测试集后数据数量为1488anger_data.txt186anger_test.txt186anger_val.txt8:1:12459disgust_data.txt307disgust_test.txt
fine_tuning_data.zip可直接用bert进行微调的中文情绪数据 Fine_tuning_data.zip Chinese emotion data that can be fine-tuned directly with bert
CapsuleNetWork从TensorFlow复现代码理解胶囊网络DynamicRoutingBetweenCapsules 从TensorFlow复现代码理解胶囊网络(DynamicRoutingBetweenCapsules)论文链接:https://arxiv.org/abs/1710.09829Tensorflow代码复现链接:https://github.com/naturomics/CapsNet-Tensor