7克 l7g是Curoverse Research正在开发的Lightning系统的主要代码库。 该存储库包含有关Lightning各个方面的文档,源代码和管道。 这里的代码应视为“研究级”,并且仍在进行中。 总览 闪电是基于“基因组平铺”的系统。 基因组被分成小段,平均长约250个碱基对(bp),这些小段称为“小块”。 对于给定的基因组数据种群,将基因组序列与重复数据已重复的图块进行图块化。 合并所有唯一的图块会创建一个“闪电图块库”,在该库中,可以通过使用位置参考将人口池中的源序列存储到闪电图块库中。 通过将索引数组存储在引用其基础序列的Lightning磁贴库中,可以创建基因组的紧凑表示形式。 我们开发的紧凑基因组表示形式的一种表示形式称为“紧凑基因组格式”(CGF),它可以表示整个基因组的大小约为30Mb,具体取决于原始基因组样本中低质量数据的数量。 目录结构 cwl-v