Ta上传的资源 (0)

通用搜索引擎的处理对象是互联网网页,截至目前的网页数量数以百万计,所以搜索引擎首先面临的问题就是如何能够设计出高效的下载系统,将如此海量的网页数据传送到本地,在本地形成互联网网页的镜像备份。网络爬虫即扮演如此角色。它是搜索引擎中及其关键的基础构件。

此代码是基于SMTP协议下的Linux字符简版邮箱客户端 ,base64编码加密,收邮件,发邮件。@163,@sina已测试通过。

implement multi-attribute linear hashed files. -placement of tuples in buckets determined by MA hash. -file expansion organised via linear hashing.