在线教育项目 1.dwd数据清洗数据脱敏清洗规则脱敏字段,存储基础表 2.dws降维对表轻度聚合做题表课程表主修行业表试卷表。 3.join方式:SparkSQL、DFAPI、DSAPI,RDDDFDS三者区别优点和劣势。 宽表:几张宽表,字段。 拉链表:缓慢变化的字段(vip等级用户支付金额) 4.用户注册模块:统计各个平台注册人数,通过url地址跳转的注册人数,top3用户支付金额对内分析各部门贡献程度。 做题模块:统计试卷分数、做题情况、做题难易度对外用户。