为了对DNA序列进行分类,k-mer频率被广泛使用,因为它可以将可变长度的序列转换为固定长度和数字特征向量。 但是,在固定长度的DNA序列分类的情况下,从给定序列的特定位置开始的子序列也可以用作分类特征。 通过对六个固定长度DNA序列数据集的性能评估,我们基于上述思想的算法与其他最新算法相比具有可比或更好的性能。