Mastering Wget & Learning Unele Trucuri de Descarcare Neat

Mastering Wget & Learning Unele Trucuri de Descarcare Neat / Linux

Uneori nu este suficient să salvați un site web din browserul dvs. Uneori ai nevoie de puțină putere. Pentru aceasta, există un instrument de linie de comandă cunoscut sub numele de Wget. Wget este un program simplu care poate descărca fișiere de pe Internet. Puteți sau nu să știți prea multe despre Wget, dar după ce ați citit acest articol, veți fi pregătit să îl utilizați pentru tot felul de trucuri.

Wget este disponibil pentru a folosi nativ în UNIX și linia de comandă Windows, dar este posibil să instalați wget pe Mac OS X Cum să obțineți Wget pentru Mac Cum să obțineți Wget pentru Mac Mac-urile sunt excelente, cu un UI îngrijit și un Unix înapoi -Sfârșit. Uneori ai senzația că poți să faci ceva cu ei. Până în ziua în care încerci să faci ceva simplu și tu ... Citește mai mult, cu un pic de coaxing. Deci, odată ce cunoașteți tipurile de lucruri pe care le puteți utiliza pentru Wget, este portabil pentru oricare sistem de operare pe care îl utilizați - și asta este util. Ce este chiar mai bine este faptul că wget poate fi folosit în fișiere batch și cron jobs. Aici începem să vedem puterea reală din spatele Wget.

De bază Wget

Utilizarea de bază este wget URL.

 wget http://makeuseof.com/

Cele mai simple opțiuni pe care majoritatea oamenilor trebuie să le cunoască sunt fundalul (wget -b), continuați descărcarea parțială (wget -c), numărul de încercări (wget -tries = NUMBER) și, desigur, ajuta (wget -h) pentru a vă reaminti de toate opțiunile.

wget -b -c - tries = NUMBER URL

Opțiuni Wget moderate avansate

Wget poate rula, de asemenea, în fundal (wget -b), limitați viteza descărcării (wget -limit-rate = SPEED), niciun părinte nu vă asigură că descărcați doar un sub-director (wget -np), actualizați numai fișierele modificate (wget -N), oglindă un site (wget -m), asigurați-vă că nu sunt create noi directoare (wget -nd), să accepte numai anumite extensii (wget -accept = LIST) și setați un timp de așteptare (wget -wait = SECONDS).

wget -b --limit-rate = VITEZĂ -np -N -m -nd --accept = LIST --wait = SECONDS URL

Descărcați cu Wget Recursiv

Puteți descărca în mod recursiv (wget -r), găzduiește alte domenii (wget -H), convertiți linkurile către versiuni locale (wget -convert-links) și setați nivelul recurențelor (wget -level = NUMBER folosind inf sau 0 pentru infinit).

Dar unele site-uri nu doresc să vă lase să descărcați în mod recursiv și veți verifica ce browser folosiți în încercarea de a bloca botul. Pentru a face acest lucru, declarați un agent utilizator, cum ar fi Mozilla (wget -user-agent = AGENT).

wget -r -H --convert-links --level = NUMBER --user-agent = Adresă AGENT

Parola protejată Wget

Este posibil să se declare numele de utilizator și parola pentru o anumită adresă URL în timp ce se utilizează wget (wget -http-user = UTILIZATOR -http-password = PASS). Acest lucru nu este recomandat pe mașinile partajate, deoarece oricine care vizualizează procesele va putea vedea parola în text simplu.

wget --http-user = UTILIZATOR --http-password = PASS URL

Un exemplu de acest lucru în acțiune este utilizarea Wget pentru a vă susține sarcinile de la Amintiți-vă de laptele Cele mai bune sfaturi de rezervă pentru Sarcini dvs. RememberTheMilk Cele mai bune sfaturi de rezervă pentru Sarcini dvs. RememberTheMilk Pentru mulți dintre noi care lucrează în nor, să ne bazăm foarte mult pe serviciile noastre preferate. De asemenea, uneori îi iubim și avem încredere în ei, poate puțin mai mult decât ar trebui uneori, ... Citește mai mult .

Descărcați Wget Bulk

Mai întâi, creați un fișier text al tuturor adreselor URL pe care doriți să le descărcați utilizând wget și apelați-l wget_downloads.txt. Apoi, pentru a descărca în bloc hărți URL, introduceți această comandă:

wget -i wget_downloads.txt

Cool foloseste pentru Wget

Acest lucru va accesa cu crawlere un site Web și va genera un fișier jurnal cu orice link-uri rupte:

wget --spider -o wget.log -e roboți = off - așteptați 1 -r -p http://www.mysite.com/

Acesta va lua un fișier text al blogurilor preferate de muzică și va descărca fișierele MP3 noi:

wget -r --level = 1 -H --timeout = 1 -a -N -np --accept = mp3 -e robots = off -i musicblogs.txt

Ce altceva folosiți pentru Wget?

Image Credit: conexiune socială prin intermediul ShutterStock, tânărul care urmărește TV prin Shutterstock, Globe prin Shutterstock

Explorați mai multe despre: Gestionarea descărcării, Navigarea offline.