MIDAS Task3 Summer Internship 2021 源码

person_96304 16 0 ZIP 2021-05-08 17:05:32

MIDAS-Task3-Summer-Internship-2021 欢迎来到Neel Bhandari的Task3提交 我专注于4个具体任务: 数据清理 数据探索和可视化 用于类别预测的模型开发 未来的工作 笔记本专注于所有4个部分。 我使用的模型包括:在TF-IDF上: 朴素贝叶斯 K最近邻居分类器 随机森林 支持向量机 逻辑回归 堆叠分类器:无法实施。 关于嵌入: LSTM 对于每种模型,我都提供了详细的使用说明,并根据研究结果对结果进行了解释,并解释了为什么将其与其他模型进行比较。 让我们详细介绍所有子任务: 1.数据清理: 首要任务是处理数据集中的冗余特征。 这包括唯一的ID,URL列等。对于每一列,我都提供了详细说明,说明我为什么删除它们,无论是通过研究还是通过统计证明它们与当前存在的其他更全面的列无关。 这是该过程不可或缺的一部分,因为它允许我们通过将噪声引

用户评论
请输入评论内容
评分:
暂无评论