使用机器学习的数据科学薪水估计器:这个项目是我个人的经验它与我的朋友自动化了机器学习算法我们为了了解该项目的整个生命周期而建立了该算法。 该项目的主要目的是根据
数据科学薪酬估算器:项目概述 创建了一个估算数据科学人员薪水(MAE〜$ 11K)的工具,以帮助数据科学家在找到工作时就其收入进行协商。 使用python和selenium从glassdoor上刮取了1000多个工作描述,每个工作描述文本中的工程设计功能可量化公司对python,excel,aws和spark的重视程度。 使用GridsearchCV优化了线性,套索和随机森林回归,以达到最佳模型。 使用Flask构建面向客户的API 网页搜刮(* ) 调整了Web抓取器github repo(上方),以从glassdoor.com抓取1000个职位发布。 对于每一项工作,我们得到以下信息: 职称 薪金估算 职位描述 评分 公司 地点 公司总部 公司规模 公司成立日期 所有权类型 行业 部门 收入 竞争者 数据清理 建筑模型 首先,我将分类变量转换为伪变量。 我也将数据分为训练和测试集
文件列表
Data-Science-Salary-Estimator-using-Machine-Learing-main.zip
(预估有个8文件)
Data-Science-Salary-Estimator-using-Machine-Learing-main
data_input.py
1KB
data_eda.ipynb
693KB
app.py
759B
README.md
2KB
data_collection.py
249B
data_cleaning.ipynb
1.11MB
correlation_visual.png
9KB
model_file.p
7MB
暂无评论