基于DeepWeb的信息采集系统.pdf 随着互联网技术的迅速发展,大量结构化的高质量信息被埋入网络,却无法被传统的搜索引擎检索到,进而难以 被挖掘利用。针对这一现象,提出了基于DeepWeb的信息采集系统,设计了基于Web的查询方式,并结合数据挖掘的相 关技术,获取并挖掘深网信息资源,解决传统手工采集信息的弊端,提高系统的使用效率,避免人
两棵树的公共子树查找算法综述pdf 本文通过对基于两棵树中的公共子树查找问题在有根、带标记、有序树中的主要 算法及相关历史的回顾,结合算法思想将公共子树查找问题分为主要3类。本文深入探讨了 每类算法中的代表算法,其中根据数据挖掘中枚举树相关技术提出了一种可能的公共子树查 找算法的思想。最后比较了文中主要算法的效率,同时较为深入地分析和