Lempel-Ziv复杂性已被广泛用于序列比较,并取得了可喜的结果,但是直到现在,尚未研究详尽历史中组件的分布。 本文研究了LZ单词的整体分布,并提出了一种用于序列比较的新统计方法。 考虑到组件的长度,我们修改了Lempel-Ziv的复杂度,并获得了各种LZ词集。 我们没有计算LZ单词的内容,而是定义了一系列LZ单词集的设置操作来比较生物序列。 为了评估该方法的有效性,我们进行了两组实验,并将其与基于比对的方法进行了比较。