BOVERI-561 从商业样本中提取插入/删除呼叫。 商业样本运行ID的列表在BOVERI-532中。 相应的输入文件位于data/BOVERI-532.csv 。 特定于运行的结果 此存储库中的代码每次运行都会生成一个TSV文件,其中包含所有(几乎)未过滤的indel的列表。 唯一已应用的过滤器是 舍弃变体支持中至少有5个缺口的比对, 筛选出低质量区域中比对所支持的变体,该低质量区域定义为断点前后3个碱基的区域,且读簇内的平均质量对于所考虑区域的所有碱基最多为20。 TSV文件中用于运行的每个条目均包含变体的常规字段(染色体,位置,参考序列,替代序列,VAF)以及以下字段 样品:观察到变异的样品ID run_id:包含此样本的运行ID run_name:运行名称 v_type:DEL,INS,DELINS,MNV 分数:与变体相关的惩罚(高惩罚意味着低置信度) 复杂度: