Jacob处理Word文档搞定了
开发步骤: 首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大 1、将压缩包解压后,Jacob.jar添加到Libraries中; 2、将Jacob.dll放至“WINDOWSSYSTEM32”下面。 当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = "C:\AA"; 只指定到了文件夹一级,正确写法是String htmlfile = "C:\AA\xxx.html"; 到此WORD/EXCEL转换HTML就已经差不多了,相信大家应该很清楚了:) 二、使用XPDF将PDF转换为HTML 1、下载xpdf最新版本,地址:http://www.foolabs.com/xpdf/download.html 我下载的是xpdf-3.02pl2-win32.zip 2、下载中文支持包 我下载的是xpdf-chinese-simplified.tar.gz 3、下载pdftohtml支持包 地址:htt p://sourceforge.net/projects/pdftohtml/ 我下载的是:pdftohtml-0.39-win32.tar.gz 4、解压调试 1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推; 2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录; 3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录; 4) 目录结构: +---[X:xpdf] |-------各种转换用到的exe文件 | |-------xpdfrc | +------[X:xpdfxpdf-chinese-simplified] | | +-------很多转换时需要用到的字符文件 xpdfrc:此文件是用来声明转换字符集对应路径的文件 5) 修改xpdfrc文件(文件原名为sample-xpdfrc) 修改文件内容为: Txt代码 #----- begin Chinese Simplified support package cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap toUnicodeDir xpdf-chinese-simplifiedCMap fontDir C:WINDOWSFonts displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf #----- end Chinese Simplified support package 6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格) 内容为: Txt代码 @echo off set folderPath=%1 set filePath=%2 cd /d %folderPath% pdftohtml -enc GBK %filePath% exit 7) 创建类 Java代码 String cmd = "....";此处代码是调用创建的bat文件进行转换 8) 测试转换 Java代码 以上就是整理的内容,后续还会添加视频转换为FLV格式,如果需要的话:) 说的不是很详细,碰到问题的朋友可以自己努力解决一下:) p://sourceforge.net/projects/pdftohtml/ 我下载的是:pdftohtml-0.39-win32.tar.gz 4、解压调试 1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推; 2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录; 3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录; 4) 目录结构: +---[X:xpdf] |-------各种转换用到的exe文件 | |-------xpdfrc | +------[X:xpdfxpdf-chinese-simplified] | | +-------很多转换时需要用到的字符文件 xpdfrc:此文件是用来声明转换字符集对应路径的文件 5) 修改xpdfrc文件(文件原名为sample-xpdfrc) 修改文件内容为: Txt代码 #----- begin Chinese Simplified support package cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap toUnicodeDir xpdf-chinese-simplifiedCMap fontDir C:WINDOWSFonts displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf #----- end Chinese Simplified support package 6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格) 内容为: Txt代码 @echo off set folderPath=%1 set filePath=%2 cd /d %folderPath% pdftohtml -enc GBK %filePath% exit 7) 创建类 Java代码 String cmd = "....";此处代码是调用创建的bat文件进行转换 8) 测试转换 Java代码 以上就是整理的内容,后续还会添加视频转换为FLV格式,如果需要的话:) 说的不是很详细,碰到问题的朋友可以自己努力解决一下:)
文件列表
Jacob处理Word文档搞定了
(预估有个103文件)
MultiFace.aps
4KB
MultiFace_i.c
1KB
MultiFace_p.c
14KB
dlldata.c
839B
DispatchTest.class
2KB
ScriptTest2.class
2KB
test.class
6KB
sa_test.class
2KB
safearray.class
3KB
ScriptTest.bat
48B
用户评论