使用RNA序列,已鉴定出数以万计的新转录本和同工型(Djebali等,自然,2012; Carbili等,基因与发展,2011)。这些隐藏的转录组的发现使区分编码和非编码RNA的需求重新焕发活力。 。 但是,大多数以前的编码潜力预测方法都严重依赖于比对,即成对比对以搜索蛋白质证据或多重比对以计算系统发育保守性得分(例如CPC,PhyloCSF和RNACode)。 这是因为大多数以前鉴定的转录本,包括蛋白质编码RNA和短的管家/调控RNA(例如snRNA,snoRNA和tRNA)都是高度保守的。 尽管仍然非常有用,但是这些方法有一些局限性:大多数lncRNA保守性较低,并且倾向于谱系特异性,这极大地限制了基于比对的方法的区分能力。 例如,从斑马鱼中检测到550个lncRNA,其中只有29个具有可检测序列