如何使用node编写可抓取ajax内容的爬虫? - CNode技术社区

谢谢有做过这方面的么？之前百度/谷歌说是可以用headless 浏览器-PhantomJs先来解析页面。但是发现速度挺慢的。不知道是我用法不对还是？

zsxsoft 1楼•11 年前

1

http://stackoverflow.com/questions/9486377/how-can-i-control-phantomjs-to-skip-download-some-kind-of-resource 可以试试让Phantomjs不下载某些文件，如图片文件，能大大加快页面下载速度。

shikelong 2楼•11 年前作者

@zsxsoft O(∩_∩)O谢谢去试试

bugall 3楼•11 年前

cheerio 模块

alsotang 4楼•11 年前

如果 ajax 的话，要不试着直接抓对应数据接口？

回到顶部