在人类基因组上存在着涉及到不同序列长度的结构变异,这些结构变异对癌症的发生和发展产生了显著的影响。随着新一代测序技术的发展以及测序成本的降低使得在全基因组水平研究结构变异变得可能,基于聚类算法对千人基因组三个不同地区的样本以及CGHub数据库中结直肠癌样本进行了结构变异识别,并基于间断点处的序列同源性对结构变异的形成机制进行了分析;利用方差分析及非参数检验分析了结构变异和癌症的关系以及结构变异与地域之间的关系。最后,探讨了该领域未来的发展趋势。