归档文件重复数据删除工具。它能做什么?它使用硬链接合并重复文件。如何检测重复文件?此工具假定如果两个文件共享某些条件,则它们具有相同的内容,因此可以合并它们。哪些是可能的标准?它们实际上是可配置的(请参阅“filededup --help”,查找“--eval”)。简要:inode访问标志(“ls -l”输出中的“-rw-r--”列)。所有者(用户和组)保存文件系统的设备号。文件内容的md5、sha1、sha256、sha512、ripemd160等,并且可能仅在前N个字节上。主要思想是用尽可能少的工作量检测重复文件。默认情况下,处理是这样完成的:所有文件都分组在集群中,其中每个集群包含共享所有这些的所有文件:尺寸、所有者、团体,然后,根据前4096个字节的sha1划分每个簇。然后,根据文件内容的hash值进行进一步筛选处理。
暂无评论