一种基于概率模型的RNA Seq数据分析方法

VergilYe 11 0 PDF 2021-04-26 04:04:16

RNA-Seq是基于高通量测序技术对转录组进行研究的实验技术,该技术正成为分析基因表达水平的重要实验手段。真核生物中普遍存在的选择性剪切导致从RNA-Seq读段到参考序列存在剪切异构体多源映射,并且读段在参考序列上呈非均匀分布,这都给剪切异构体表达水平的计算带来挑战。本文基于文本数据与RNA-Seq数据在结构上具有的高度相似性,将文本数据分析中流行的概率模型LDA应用于RNA-Seq数据分析,设计了NU-LDA模型以测量读段在非均匀分布情况下基因和剪切异构体的表达水平。通过采用真实实验数据进行验证并与其他方法进行对比,本文设计的模型获得了较为准确的计算结果。

一种基于概率模型的RNA Seq数据分析方法

用户评论
请输入评论内容
评分:
暂无评论