product classification:Flipkart产品数据集上的产品分类源码

qqphilosophical37824 19 0 ZIP 2021-04-27 09:04:54

MIDAS @ IIITD 2021年夏季实习我尝试参加MIDAS @ IIITD 2021年夏季实习计划的任务3(NLP)。任务的目标是主要使用产品说明来预测产品的主要类别。资料准备标签数据集不直接具有主要类别属性。但是,它包含一个名为product_category_tree的属性,使用该属性可以提取主要类别。我注意到有些产品没有分配给主要类别。我将此类产品分组在一起,并删除了相应的行。此外,数据集非常不平衡。大约30%的产品属于“服装”类别,依此类推。因此,我只按产品数量从小到大的顺序集中在前15个类别上。由于缺少此类训练示例,因此添加更多类别将导致准确性下降。另一方面,如果仅考虑前5个或前10个类别,则可以提高准确性。描述该描述已经过如下预处理: 删除所有非字母字符和多余的空格。将字符串转换为小写。从字符串中删除停用词。我spa

文件列表

product-classification-master.zip (预估有个9文件)

product-classification-master

preprocessed.csv 5.8MB

naive_bayes.ipynb 128KB

lstm.ipynb 78KB

bert.ipynb 52KB

requirements.txt 2KB

README.md 5KB

dataset.csv 36.37MB

.gitignore 36B

setup.sh 224B

用户评论

暂无评论

python实现zencart产品数据导入到magento python导入数据

python版本要求在3.3.x,需要mysql connector for python第三方库支持不适用所有的zencart导入到magento 复制代码代码如下:#encoding=utf-8

14 2021-02-25
Malignant Lymphoma Classification恶性淋巴瘤分类数据集

恶性淋巴瘤是一种影响淋巴结的癌症。一组代表三种类型的恶性淋巴瘤:CLL(慢性淋巴细胞性白血病);FL(滤泡状淋巴瘤); MCL(套细胞淋巴瘤)。从经切片并用苏木精/曙红(H + E)染色的活组织检查中

10 2021-04-25
化妆品数据集.zip

基于PaddleX的化妆品数据集,包含8类。数据集背景：Paddle官方给的markup化妆品数据的基础上增加perfume(香水)一类数据集.数据集内容：包含blush、eyeshow、eyesha

10 2020-07-29
开发数据产品源码

开发数据产品

5 2021-02-24
fashion_product_classification With_HuggingFace_BERT源码

Hugging Face PyTorch BERT的照片序列分类模型的BERT的结构( ) 测试결과95%의准确度를보여줌

16 2021-04-28
fashion mnist类似于MNIST的时尚产品数据库基准测试源码

时尚MNIST 目录 Fashion-MNIST是文章图像的数据集-包含60,000个示例的训练集和10,000个示例的测试集。每个示例都是一个28x28灰度图像,与来自10个类别的标签相关联。我

17 2021-02-17
瑞星网络版产品数据库重装工具

可用与网络版产品数据库损坏后重装工作，避免重装系统中心所带来的不便

17 2020-06-10
M3352核心板产品数据手册V1.03

致远M3352核心板数据手册，最新版。适用于想要选择进行开发的先行阅读。

23 2019-09-07
论文研究产品数据管理系统实施方法学.pdf

论文研究-产品数据管理系统实施方法学.pdf, 提出了产品数据管理系统的实施概念 ,并从系统工程角度提出了产品数据管理实施的策略 ,给出了的产品数据管理系统的实施步骤和技术路线 .探讨了产品数据管理

8 2020-07-17
2011年12月10日产品数据包

震东产品数据包

17 2019-05-05

product classification:Flipkart产品数据集上的产品分类 源码

文件列表

用户评论

推荐下载

product classification:Flipkart产品数据集上的产品分类源码