改程序利用htmlParser这个jar包实现了对网页的解析,实现了对网址,网页的标题,网页上的图片,网页的内容的额入库操作。使用mySQL数据库。但是,在网页内容的提取方面还有很多的问题,毕竟各个网页的风格不一样,所以大家可以根据自己的需要做一下修改。但是最大的问题还是在于目前的技术解决不了动态网页的解析问题。其实严格来说是可以解决的,只是太难了,相当于编写一个浏览器,大家应该用过浏览器的审查元素的功能,里面可以查看动态元素的源码,就是这个道理。我的另外一个思路是,将网页保存到本地,这时用记事本打开可以看到动态的源码,然后解析即可,但是目前程序还没有实现这一功能,希望有想法的可以和我交流一下