开发步骤: 首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大   1、将压缩包解压后,Jacob.jar添加到Libraries中;   2、将Jacob.dll放至“WINDOWSSYSTEM32”下面。 当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = "C:\AA";   只指定到了文件夹一级,正确写法是String htmlfile = "C:\AA\xxx.html";   到此WORD/EXCEL转换HTML就已经差不多了,相信大家应该很清楚了:)  二、使用XPDF将PDF转换为HTML   1、下载xpdf最新版本,地址:http://www.foolabs.com/xpdf/download.html   我下载的是xpdf-3.02pl2-win32.zip   2、下载中文支持包   我下载的是xpdf-chinese-simplified.tar.gz   3、下载pdftohtml支持包   地址:htt p://sourceforge.net/projects/pdftohtml/   我下载的是:pdftohtml-0.39-win32.tar.gz   4、解压调试   1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推;   2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录;   3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录;   4) 目录结构:  +---[X:xpdf]            |-------各种转换用到的exe文件            |            |-------xpdfrc            |            +------[X:xpdfxpdf-chinese-simplified]                                       |                                       |                                       +-------很多转换时需要用到的字符文件   xpdfrc:此文件是用来声明转换字符集对应路径的文件   5) 修改xpdfrc文件(文件原名为sample-xpdfrc)   修改文件内容为:   Txt代码    #----- begin Chinese Simplified support package cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap toUnicodeDir xpdf-chinese-simplifiedCMap fontDir C:WINDOWSFonts displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf #----- end Chinese Simplified support package   6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格)   内容为:   Txt代码   @echo off set folderPath=%1 set filePath=%2 cd /d %folderPath% pdftohtml -enc GBK %filePath% exit   7) 创建类   Java代码     String cmd = "....";此处代码是调用创建的bat文件进行转换    8) 测试转换   Java代码    以上就是整理的内容,后续还会添加视频转换为FLV格式,如果需要的话:)   说的不是很详细,碰到问题的朋友可以自己努力解决一下:) p://sourceforge.net/projects/pdftohtml/   我下载的是:pdftohtml-0.39-win32.tar.gz   4、解压调试   1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推;   2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录;   3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录;   4) 目录结构:  +---[X:xpdf]            |-------各种转换用到的exe文件            |            |-------xpdfrc            |            +------[X:xpdfxpdf-chinese-simplified]                                       |                                       |                                       +-------很多转换时需要用到的字符文件   xpdfrc:此文件是用来声明转换字符集对应路径的文件   5) 修改xpdfrc文件(文件原名为sample-xpdfrc)   修改文件内容为:   Txt代码    #----- begin Chinese Simplified support package cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap toUnicodeDir xpdf-chinese-simplifiedCMap fontDir C:WINDOWSFonts displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf #----- end Chinese Simplified support package   6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格)   内容为:   Txt代码   @echo off set folderPath=%1 set filePath=%2 cd /d %folderPath% pdftohtml -enc GBK %filePath% exit   7) 创建类   Java代码     String cmd = "....";此处代码是调用创建的bat文件进行转换    8) 测试转换   Java代码    以上就是整理的内容,后续还会添加视频转换为FLV格式,如果需要的话:)   说的不是很详细,碰到问题的朋友可以自己努力解决一下:)