行星际回程(ipwb) 网络档案的点对点永久性 行星际回程(ipwb)通过将文件的内容传播到IPFS网络中,促进了Web归档中的持久性和协作。 是对等内容可寻址文件系统,其固有地允许重复数据删除并促进选择复制。 ipwb在将WARC响应记录的标头和有效负载分散到IPFS之前,以利用重复数据消除功能,使用返回的IPFS散列的引用构建,并在重播时将IPFS的标头和有效负载合并。 行星际回溯主要由两个脚本组成: ipwb / indexer.py-归档索引脚本,用于获取WARC输入的路径,从指定的WARC提取HTTP标头,HTTP有效负载(响应主体)和WARC响应记录标头的相关部分,并创建字