webStraktor - Web 数据抽取客户端


GPL
跨平台
Java

软件简介

webStraktor 是一个可编程的 WWW 数据抽取客户端,提供一个脚本语言用于收集、抽取和存储来自 Web 的数据,包括图片。脚本语言使用正则表达式和
XPath 语法。标准输出为 XML 格式,支持 ASCII、UTF-8 和 ISO885_1 。提供日志记录和跟踪信息。