Spidr 是一个Ruby 的网页爬虫库,可以将整个网站、多个网站、某个链接完全抓取到本地。
安装方法:sudo gem install spidr
代码示例:
Spidr.start_at('http://tenderlovemaking.com/') Spidr.site('http://rubyinside.org/') do |spider| spider.every_url { |url| puts url } end