linux命令之wget命令
linux命令之wget命令
wget命令是linux下用來(lái)從指定的url地址下載文件。下面由學(xué)習(xí)啦小編為大家整理了linux命令之wget命令的相關(guān)知識(shí),希望對(duì)大家有所幫助!
linux命令之wget命令詳解
wget命令用來(lái)從指定的URL下載文件。wget非常穩(wěn)定,它在帶寬很窄的情況下和不穩(wěn)定網(wǎng)絡(luò)中有很強(qiáng)的適應(yīng)性,如果是由于網(wǎng)絡(luò)的原因下載失敗,wget會(huì)不斷的嘗試,直到整個(gè)文件下載完畢。如果是服務(wù)器打斷下載過(guò)程,它會(huì)再次聯(lián)到服務(wù)器上從停止的地方繼續(xù)下載。這對(duì)從那些限定了鏈接時(shí)間的服務(wù)器上下載大文件非常有用。
語(yǔ)法
wget(選項(xiàng))(參數(shù))
選項(xiàng)
-a<日志文件>:在指定的日志文件中記錄資料的執(zhí)行過(guò)程;
-A<后綴名>:指定要下載文件的后綴名,多個(gè)后綴名之間使用逗號(hào)進(jìn)行分隔;
-b:進(jìn)行后臺(tái)的方式運(yùn)行wget;
-B<連接地址>:設(shè)置參考的連接地址的基地地址;
-c:繼續(xù)執(zhí)行上次終端的任務(wù);
-C<標(biāo)志>:設(shè)置服務(wù)器數(shù)據(jù)塊功能標(biāo)志on為激活,off為關(guān)閉,默認(rèn)值為on;
-d:調(diào)試模式運(yùn)行指令; -D<域名列表>:設(shè)置順著的域名列表,域名之間用“,”分隔; -e<指令>:作為文件“.wgetrc”中的一部分執(zhí)行指定的指令;
-h:顯示指令幫助信息;
-i<文件>:從指定文件獲取要下載的URL地址;
-l<目錄列表>:設(shè)置順著的目錄列表,多個(gè)目錄用“,”分隔;
-L:僅順著關(guān)聯(lián)的連接;
-r:遞歸下載方式;
-nc:文件存在時(shí),下載文件不覆蓋原有文件;
-nv:下載時(shí)只顯示更新和出錯(cuò)信息,不顯示指令的詳細(xì)執(zhí)行過(guò)程;
-q:不顯示指令執(zhí)行過(guò)程; -nh:不查詢主機(jī)名稱; -v:顯示詳細(xì)執(zhí)行過(guò)程;
-V:顯示版本信息;
--passive-ftp:使用被動(dòng)模式PASV連接FTP服務(wù)器;
--follow-ftp:從HTML文件中下載FTP連接文件。
參數(shù)
URL:下載指定的URL地址。
linux命令之wget命令實(shí)例
測(cè)試下載鏈接
當(dāng)你打算進(jìn)行定時(shí)下載,你應(yīng)該在預(yù)定時(shí)間測(cè)試下載鏈接是否有效。我們可以增加--spider參數(shù)進(jìn)行檢查。
wget --spider URL
如果下載鏈接正確,將會(huì)顯示:
Spider mode enabled. Check if remote file exists.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Remote file exists and could contain further links,
but recursion is disabled -- not retrieving.
這保證了下載能在預(yù)定的時(shí)間進(jìn)行,但當(dāng)你給錯(cuò)了一個(gè)鏈接,將會(huì)顯示如下錯(cuò)誤:
wget --spider url
Spider mode enabled. Check if remote file exists.
HTTP request sent, awaiting response... 404 Not Found
Remote file does not exist -- broken link!!!
你可以在以下幾種情況下使用--spider參數(shù):
定時(shí)下載之前進(jìn)行檢查
間隔檢測(cè)網(wǎng)站是否可用
檢查網(wǎng)站頁(yè)面的死鏈接
增加重試次數(shù)
wget --tries=40 URL
如果網(wǎng)絡(luò)有問(wèn)題或下載一個(gè)大文件也有可能失敗。wget默認(rèn)重試20次連接下載文件。如果需要,你可以使用--tries增加重試次數(shù)。
下載多個(gè)文件
wget -i filelist.txt
首先,保存一份下載鏈接文件:
cat > filelist.txt
url1
url2
url3
url4
接著使用這個(gè)文件和參數(shù)-i下載。
鏡像網(wǎng)站
wget --mirror -p --convert-links -P ./LOCAL URL
下載整個(gè)網(wǎng)站到本地。
--miror開(kāi)戶鏡像下載。
-p下載所有為了html頁(yè)面顯示正常的文件。
--convert-links下載后,轉(zhuǎn)換成本地的鏈接。
-P ./LOCAL保存所有文件和目錄到本地指定目錄。
過(guò)濾指定格式下載
wget --reject=gif ur
下載一個(gè)網(wǎng)站,但你不希望下載圖片,可以使用這條命令。
把下載信息存入日志文件
wget -o download.log URL
不希望下載信息直接顯示在終端而是在一個(gè)日志文件,可以使用。
限制總下載文件大小
wget -Q5m -i filelist.txt
當(dāng)你想要下載的文件超過(guò)5M而退出下載,你可以使用。注意:這個(gè)參數(shù)對(duì)單個(gè)文件下載不起作用,只能遞歸下載時(shí)才有效。
下載指定格式文件
wget -r -A.pdf url
可以在以下情況使用該功能:
下載一個(gè)網(wǎng)站的所有圖片。
下載一個(gè)網(wǎng)站的所有視頻。
下載一個(gè)網(wǎng)站的所有PDF文件。
FTP下載
wget ftp-url
wget --ftp-user=USERNAME --ftp-password=PASSWORD url
可以使用wget來(lái)完成ftp鏈接的下載。
使用wget匿名ftp下載:
wget ftp-url
使用wget用戶名和密碼認(rèn)證的ftp下載:
wget --ftp-user=USERNAME --ftp-password=PASSWORD url