如何使用wget和获取网站上的所有文件?
wget
我需要除 HTML、PHP、ASP 等网页文件之外的所有文件。
要过滤特定的文件扩展名:
wget -A pdf,jpg -m -p -E -k -K -np http://site/path/
或者,如果您更喜欢长选项名称:
wget --accept pdf,jpg --mirror --page-requisites --adjust-extension --convert-links --backup-converted --no-parent http://site/path/
这将镜像站点,但没有jpg或pdf扩展名的文件将被自动删除。
jpg
pdf