如何使用node编写可抓取ajax内容的爬虫?
谢谢 有做过这方面的么? 之前百度/谷歌说是可以用headless 浏览器-PhantomJs先来解析页面。但是发现速度挺慢的。 不知道是我用法不对还是?
4 回复
http://stackoverflow.com/questions/9486377/how-can-i-control-phantomjs-to-skip-download-some-kind-of-resource 可以试试让Phantomjs不下载某些文件,如图片文件,能大大加快页面下载速度。
@zsxsoft O(∩_∩)O谢谢 去试试
cheerio 模块
如果 ajax 的话,要不试着直接抓对应数据接口?