Master Thesis论文提交至西安电子科技大学攻读硕士学位
本论文的主要内容概括如下:第一部分重点解决跑步滥用问题计算后缀数组时的内存,我们开发了一个轻量级的结构DCV,结果与LS对比。第二部分,我们开发了两个实用的CSA(compressed suffix array)结构,称为Gam-CSA和Adaptive-CSA。我们划分间隙序列将Phi数组分成块并使用伽马编码、数据感知编码Gam-CSA和Adaptive-CSA分别。实验表明显著优于其他CSA。在最后一部分,我们设计了一个高效的FM-index,称为Adaptive-FM,使用一个通用的结构,即WT(小波树)。WT中的BitMap是分开的进入块并为每个块使用数据感知等级,就像在Adaptive-CSA。实验显示出显著的优势,尤其是在空间方面。CSA和FM:基于CSA或FM的数据压缩软件: