基于代价的最优查询计划生成方法
本文针对分布式数据库查询效率随着数据规模的增大而降低的问题,以Greenplum分布式数据库为研究对象,从优化查询路径的角度提出了一种基于代价的最优查询计划生成方法。通过设计有效的代价模型来估算查询代价,并采用并行最大最小蚁群算法来搜索具有最小查询代价的连接顺序,即最优连接顺序;最后再根据Greenplum数据库对查询计划中不同操作的默认最优选择得到最优查询计划。我们在自主生成的数据集与事务处理性能理事会测试基准(TPC-H)的标准数据集上进行了多组实验,结果表明,所提出的优化方法能够有效地搜索出最优解,获得最优的查询计划,从而提升Greenplum数据库的查询效率。