我正在考虑尝试BeautifulSoup,一个用于HTML抓取的Python包。还有其他我应该查看的HTML抓包工具吗?Python不是必需的,我实际上也对其他语言感兴趣。
到目前为止的故事:
Mechanize
Ruby
Watir
.NET
WatiN
Perl
Web-Scraper
Java
Jericho HTML Parser
JavaScript
phantomjs
PHP
ScarletsQuery
Most of them
在Ruby世界中,相当于BeautifulSoup的是why_the_lucky_stiff的Hpricot