CONSULT:使用局部敏感的散列法精确去除污染物 源码
咨询 CONSULT是从基因组测序读取中去除污染物的工具。 依靠位置敏感的哈希,CONSULT从查询集中提取k -mers,并测试它们是否落在参考数据集中用户指定的k -mers汉明距离内。 它支持在其参考库中包含大约80亿个k- mers,以容纳数以万计的微生物物种的数据集。 现在,我们可以在线( )上获得描述算法和软件体系结构设计的论文。 我们在测试期间使用的摘要数据表和脚本可从。 原始数据存放在。 我们使用不同基因组参考集构建的自定义CONSULT库: 目前,在使用我们的库时,库名称必须保持不变,因为库文件以库名称为前缀。 这将在将来的版本中更改,以提供更大的灵活性。 系统要求 磁盘空间: CONSULT数据库的构建大约需要120GB的磁盘空间。 确切的覆盖区取决于参考集中的k个单体。 我们为使用默认设置进行测试而构建的三个主要数据库的大小在107GB至120GB之间变化。
文件列表
CONSULT-main.zip
(预估有个13文件)
CONSULT-main
minimization.cpp
7KB
map_fixed_pos
README.md
104B
main_map_fixed_pos.cpp
36KB
k35C_bef_mininimization.fa
22.32MB
main_search.cpp
39KB
LICENSE
11KB
main_map.cpp
36KB
README.md
11KB
暂无评论