QCovid:提交给ENA的sars cov 2序列+共识的QC管道 源码
QCovid 提交给ENA的SARS-CoV-2测序和装配数据的QC管道。 该代码的作用是什么? 提供有关参考基因组中是否覆盖的基本QC信息。 提供共识程序集的掩码,显示大多数读取支持哪些碱基(比例是一个参数) 因此,处理分为两个流 对于每个样品,图谱读取到不具有读取支持的参考和标记位置。如果用户提供了所用引物组的信息,则可用来推断哪些扩增子丢失。 如果用户未提供引物信息,则一般的伪引物窗口是整个基因组的图块,我们将测量哪些已被丢弃。 根据共识程序集,map读取到没有读取支持的共识和掩码位置 写入所有SQL数据的数据库,包括掩码。 该存储库包括用于管理这些质量控制结果数据库的工具。
文件列表
QCovid-master.zip
(预估有个25文件)
QCovid-master
QCovid_plots.ipynb
48KB
populate_db.py
9KB
MN908947.fasta
30KB
outputs
spec.md
416B
bin_amplicons_PE.sh
471B
primers
parse_articv3_amplicons.py
2KB
nCoV-2019.tsv
15KB
暂无评论