EMR_Pyspark 一个在EMR上运行并从S3加载并存储在S3上的pyspark脚本的简单示例。 这里的目的是从具有MapReduce心态的图像计算BoF。 未来工作:使用CNN计算功能包,并对由ORB算法和CNN计算的BoF进行聚类。 对于从该领域开始的数据科学家有用的脚本。