个人基因组处理管道 介绍 这种WGS处理/分析工作流程的灵感来自Dante Labs公司接收的临床级全基因组序列(Illumina NovaSeq)。 Dante Labs为客户提供对齐方式(作为BAM文件)和变体调用(以SNP,indel和CNV VCF文件的形式),而所有这些处理后的文件均与GRCh37(hg19)对齐,而不是最新的人类基因组构建(GRCh38或hg38)。 虽然可以更简单地使用UCSC LiftOver将hg19坐标提升到hg38,但此工作流程既是一种学习练习,又可以提供一种更好地控制WGS处理/分析工作流程的方式(将多个运行等)。 变体调用管道 作为基本概述,包含的personal_genome_processing_pipeline.sh脚本将接受成对的末端Illumina读取(以FASTQ格式),使用fastqc运行初始读取的QC指标,然后继续使用以下fastq