MIDAS Task3 Summer Internship 2021 源码
MIDAS-Task3-Summer-Internship-2021 欢迎来到Neel Bhandari的Task3提交 我专注于4个具体任务: 数据清理 数据探索和可视化 用于类别预测的模型开发 未来的工作 笔记本专注于所有4个部分。 我使用的模型包括:在TF-IDF上: 朴素贝叶斯 K最近邻居分类器 随机森林 支持向量机 逻辑回归 堆叠分类器:无法实施。 关于嵌入: LSTM 对于每种模型,我都提供了详细的使用说明,并根据研究结果对结果进行了解释,并解释了为什么将其与其他模型进行比较。 让我们详细介绍所有子任务: 1.数据清理: 首要任务是处理数据集中的冗余特征。 这包括唯一的ID,URL列等。对于每一列,我都提供了详细说明,说明我为什么删除它们,无论是通过研究还是通过统计证明它们与当前存在的其他更全面的列无关。 这是该过程不可或缺的一部分,因为它允许我们通过将噪声引
文件列表
MIDAS-Task3-Summer-Internship-2021-main.zip
(预估有个9文件)
MIDAS-Task3-Summer-Internship-2021-main
img
wine_mask.png
3KB
temp1.md
1B
saved_models_lstm
secondary_lstm.h5
7.9MB
primary_lstm.h5
7.9MB
temp.md
2B
LICENSE
1KB
MIDAS_NLP_Task3_Summer_Internship_2021.ipynb
1.25MB
暂无评论