通过crawler抓取网页指定内容.发现有jquery选择器和xpath解析两种方式。哪一种更好呢?
不知该如何选择,以前java抓取内容是用的xpath解析的。现在jquery好像更方便。哪位大哥帮忙分析下。。。
2 回复
你自己做过了就知道了。两种都能达到同样的目的。
我喜欢xpath。因为chrome的开发工具能够自动复制生成xpath。
不支持xpath的爬虫不是好爬虫。
2种都能达到目的 个人更喜欢用css选择器,简单直观,java的话jsoup是支持css选择器的