信使RNA聚腺苷酸化位点的基于分类的预测模型
真核基因期间信使RNA聚腺苷酸化是基本加工步骤之一表达。聚腺苷酸化位点[(poly(A)site]]标记文字的结尾,这也是一个基因的结尾。一个可以证明聚(A)位点的计算程序不仅可以证明用于发现基因的基因组注释有用,但也可用于预测备用聚(A)站点。 现在可以从poly(A)站点数据集提取定义poly(A)站点的功能以构建此类预测模型。使用方法,包括K语法模式,Z曲线,位置特定的评分矩阵和一阶非齐次马尔可夫子模型,生成了许多特征并放置了迪南原始功能空间。要选择最有用的功能,属性选择算法,例如利用贝叶斯模型建立信息培训和信息熵。 网络确定最佳功能的子集。对应于训练的测试模型在拟南芥中建立了最高预测聚(A)位点的模型。 构造了Poly(A)站点分类器或PAC。模型的唯一性在于初始化该结构每个子模型canbereplacedor扩展,同时功能生成,选择和分类所有独立的过程。它的模块化设计使站点很容易适应不同的物种或数据集。 该算法的高特异性和灵敏度要求在几个数据集处以字节表示, 最佳组合,两者都达到了95%。该软件包可能用于基因组注释和优化转基因结构。
暂无评论