ad2vcf ad2vdf从SAM流中提取等位基因深度信息,并将其添加到相应的单样本VCF文件中。 通过stdin读取SAM输入,并将VCF输入文件作为命令行参数。 这允许使用管道以并行方式进行昂贵的BAM / CRAM解码: samtools view -@ 2 --input-fmt-option required_fields=0x218 \ ../SRR6990379/NWD102903.b38.irc.v1.cram \ | ./ad2vcf file.vcf ad2vcf完全用C编写,并尝试优化CPU,内存和磁盘访问。 它不会将大量数据吸入RAM,因此内存使用非常简单,并且主要从缓存运行,因此速度非常快。 在现代化的工作站或服务器上,通过SRA项目处理的具有人类基因组比对的大型CRAM文件大约需要20分钟。 为了使之成为可能,SAM和VCF输入都必须首先按染色体