问题陈述 给定Company Name和Business Description ,任务是将公司分类。 共有62个类别 方法 删除重复的条目 跨类别的Wordcloud可视化 具有BOW和多项朴素贝叶斯的基线模型分别获得F-1和AUC分数分别为0.59和0.685 。 训练20时期后, RoBERTA的F-1和AUC分数分别为0.743和0.847的情况得到改善。