curl配合simple_html_dom进行页面数据抓取,扩展是自己写的,在项目中已经实践过很好用,只需要传入简单的参数就可以,省去写大量正则的烦恼,案例是抓取百度搜索