数据科学薪酬估算器:项目概述 创建了一个估算数据科学人员薪水(MAE〜$ 11K)的工具,以帮助数据科学家在找到工作时就其收入进行协商。 使用python和selenium从glassdoor上刮取了1000多个工作描述,每个工作描述文本中的工程设计功能可量化公司对python,excel,aws和spark的重视程度。 使用GridsearchCV优化了线性,套索和随机森林回归,以达到最佳模型。 使用Flask构建面向客户的API 网页搜刮(* ) 调整了Web抓取器github repo(上方),以从glassdoor.com抓取1000个职位发布。 对于每一项工作,我们得到以下信息: 职称 薪金估算 职位描述 评分 公司 地点 公司总部 公司规模 公司成立日期 所有权类型 行业 部门 收入 竞争者 数据清理 建筑模型 首先,我将分类变量转换为伪变量。 我也将数据分为训练和测试集