Company Classification using RoBERTa:基于使用Transformer架构的公司的文本信息的多类别分类(62个类别) 源码
问题陈述 给定Company Name和Business Description ,任务是将公司分类。 共有62个类别 方法 删除重复的条目 跨类别的Wordcloud可视化 具有BOW和多项朴素贝叶斯的基线模型分别获得F-1和AUC分数分别为0.59和0.685 。 训练20时期后, RoBERTA的F-1和AUC分数分别为0.743和0.847的情况得到改善。
文件列表
Company-Classification-using-RoBERTa-master.zip
(预估有个7文件)
Company-Classification-using-RoBERTa-master
.ipynb_checkpoints
Solution-001-checkpoint.ipynb
22.79MB
Multi_class_text_classification_with_RoBERTa.ipynb
23.53MB
Training_Data_Set_for_Data_Science_Case_Study.xlsx
1.81MB
README.md
514B
runs
events.out.tfevents.1593635668.04f8d77f9fae
20KB
Testing_Data_for_Data_Science_Case_Stduy.xlsx
248KB
Test Predictions.csv
18KB
暂无评论