:本文在开源(Open Souroe)项目Jakarta Lucene的基础上,结合多种开源文档格式分析工具,设计和实现了 一种可扩展的全文检索框架,该框架可高效地对XML、HTML、/VLS Word、PDF等格式的文档进行全文检索。整个框 架完全基于开源工具包,可以有效地对信息系统的开发进行支持。