针对集群服务器LARD调度算法只能利用已有缓存的问题, 提出一种基于预取的算法Prefetch_LARD.该算法从Web 访问日志中挖掘页面之间的转移概率, 建立马尔科夫链模型, 在调度请求时利用概率关系提前将下一次可能访问的文档从节点磁盘取到本地cache中, 提高了请求的缓存命中率;算法还采用了加权的节点超载判断方法,以提高集群节点的负载均衡度.实验表明, 在同样的测试环境下,Prefetch_LARD算法比LARD 算法的缓存命中率提高26.9%.系统的吞吐量相应提高18.8%.