爬取静态网页

1
2
3
4
5
6
7
8
9
10
$ wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent \
www.baidu.com

wget 工具可使用 brew 安装:

1
$ brew install wget