【发布一个库】rss 爬虫,抓取 rss 站点信息和和列表,包括正文
发布于 10 年前 作者 shanelau 7718 次浏览 最后一次编辑是 8 年前 来自 分享

之前做了好几个爬虫的项目,抓取rss的所有信息,抓取新闻的正文和图片等等。使用 java 和 nodejs 实现过。 以前写的 rss 相关的博客 csdn

自己开发的一个库,用来做新闻抓取阅读器非常合适,对Rss信息抓取有一点点心得,希望一起交流探讨,

rss爬虫 https://github.com/kissliux/rssSpider

快速开始

var spide = require('rssspider');
var url = 'http://www.bigertech.com/rss';
spide.getCleanBody(url).then(function(data){
    console.log(data); // rss  post list
});
1 回复

这个库已经升级几个版本了

回到顶部