BOVERI 561:从商业样本中提取indel呼叫 源码
BOVERI-561 从商业样本中提取插入/删除呼叫。 商业样本运行ID的列表在BOVERI-532中。 相应的输入文件位于data/BOVERI-532.csv 。 特定于运行的结果 此存储库中的代码每次运行都会生成一个TSV文件,其中包含所有(几乎)未过滤的indel的列表。 唯一已应用的过滤器是 舍弃变体支持中至少有5个缺口的比对, 筛选出低质量区域中比对所支持的变体,该低质量区域定义为断点前后3个碱基的区域,且读簇内的平均质量对于所考虑区域的所有碱基最多为20。 TSV文件中用于运行的每个条目均包含变体的常规字段(染色体,位置,参考序列,替代序列,VAF)以及以下字段 样品:观察到变异的样品ID run_id:包含此样本的运行ID run_name:运行名称 v_type:DEL,INS,DELINS,MNV 分数:与变体相关的惩罚(高惩罚意味着低置信度) 复杂度:
文件列表
BOVERI-561:从商业样本中提取indel呼叫
(预估有个123文件)
analyze_variants.py
25KB
QMRS_FFPE.csv
98B
BOVERI-568_MiSeq.csv
398B
BOVERI-568_NextSeq_clinical.csv
147B
BOVERI-568_NextSeq_commercial.csv
245B
BOVERI-532.csv
962B
BOVERI-532_blacklist.csv
62B
201002_NB551381_0087_AHFW2FAFX2_indels.tsv.gz
10.91MB
210125_NB551381_0111_AHJLY3AFX2_indels.tsv.gz
9.07MB
210204_NB551381_0117_AHMHYCAFX2_indels.tsv.gz
11.48MB
暂无评论