ad2vcf:将SAM流中的等位基因深度信息添加到VCF文件中 源码
ad2vcf ad2vdf从SAM流中提取等位基因深度信息,并将其添加到相应的单样本VCF文件中。 通过stdin读取SAM输入,并将VCF输入文件作为命令行参数。 这允许使用管道以并行方式进行昂贵的BAM / CRAM解码: samtools view -@ 2 --input-fmt-option required_fields=0x218 \ ../SRR6990379/NWD102903.b38.irc.v1.cram \ | ./ad2vcf file.vcf ad2vcf完全用C编写,并尝试优化CPU,内存和磁盘访问。 它不会将大量数据吸入RAM,因此内存使用非常简单,并且主要从缓存运行,因此速度非常快。 在现代化的工作站或服务器上,通过SRA项目处理的具有人类基因组比对的大型CRAM文件大约需要20分钟。 为了使之成为可能,SAM和VCF输入都必须首先按染色体
文件列表
ad2vcf-master.zip
(预估有个21文件)
ad2vcf-master
benchmark
878B
make-protos
127B
Test
test-bad-chr.sam
3KB
test-bad-chr.vcf
136B
test.vcf
136B
test-ad-correct.vcf
206B
test-bad-pos.sam
3KB
test-bad-pos.vcf
136B
暂无评论