信息序列分类树 insect是一种R包,用于通过分类识别由DNA元条形码分析产生的扩增子序列变体。 软件包中实现的学习和分类算法基于完整的概率模型(轮廓隐式马尔可夫模型),并提供了高度准确的分类ID,尽管计算成本较高。 该软件包还包含用于从NCBI搜索和下载参考序列和分类信息的功能,用于序列修整的“虚拟PCR”工具,用于清除错误标记的参考序列的功能以及其他一些工具。 insect被设计为与管线或其他产生一系列扩增子序列变体(ASV)的去噪工具结合使用。 尽管未过滤的序列也可以进行高精度处理,但是昆虫分类算法相对较慢,因为它使用了计算量大的动态编程算法来查找给定分类树每个节点上的模型的每个序