XCrawler - 轻量级的 PHP 爬虫框架


Apache
跨平台
PHP

软件简介

XCrawler - 轻量级、易维护的PHP爬虫框架

特性:

  • 极易上手,具备完善的文档和示例

  • 支持多并发爬取

  • 支持基于 xpath、css 选择器解析内容

  • 模拟浏览器行为,如 user-agent、cookie、提交表单

  • 支持断点续爬、失败重试、代理、并有完善的爬取日志

  • 健壮的底层库,HTTP 客户端基于 guzzle,dom 解析基于 symfony/dom-crawler 库

查看文档:https://xcrawler.yanshuju.com/docs/