wget命令恐怕是我们最常见到的Linux shell下的命令了,用途很简单粗暴,就是下载…我们最常遇到的命令无非就是“wget http://….(你要下载文件的url)”,但其实wget还有两条命令很常用到,这里就当做是一个“简单粗暴”凑数的教程吧。作为良心博客,本文参考借鉴的网址都附在后面了,大家如果想深入研究可以追索学习一下。
Wget最常用的两个命令
(1)wget下载一个网页目录下的文件
用途:我们经常看到一些有用的网站,他们提供一些电子书资源,但遗憾的是,他们的网页端并不尽如人意(如下图所示),这些网站往往只是开放了网站目录的访问权限,那么如何将这些电子资源一次性下载呢?
wget -c -r -np -k -L -p http://ni_xiang_xia_zai_wang_zhan
这个命令里给wget加了不少参数,常见的参数有
-c 断点续传 -r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件 -nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录 -np 递归下载时不搜索上层目录,如wget -c -r www.xxx.org/pub/path/ 没有加参数-np,就会同时下载path的上一级目录pub下的其它文件 -k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数 -L 递归时不进入其它主机
(2)wget批量下载多个url
当我们想要下载许多个文件(如PDF)时,也可以用wget批量下载
首先把要下载的内容,逐行加入到一个url.txt的文本文件中
然后,用下面的命令下载url.txt中的网址即可
wget -b -i url.txt
其中,-b代表后台运行wget,-i代表下载文档中的内容。
本文主要参考的URL:
1 条评论