一个实施数据科学管道的项目-提取原始数据,数据清理,特征提取,实体匹配,数据匹配,数据合并和OLAP样式探索。 选择的两个实体是Yelp和Zomato。 来自相同地点的餐厅数据将从这两个站点中提取,并且相似的餐厅将合并到一个大表中。 将会在该表上进行OLAP风格的探索,以从收集的数据中找到见解(例如,加利福尼亚州评价最高的餐厅)