Comment télécharger un site Web sous Linux (wget)
Le wget est une commande utile pour télécharger un site Web sous Linux. Par exemple,wget [url].
[example@snake ~]$ wget -r -p -k -E http://www.google.com --2009-07-19 14:07:27-- http://www.google.com/ Resolving www.google.com... 64.233.189.104 Connecting to www.google.com|64.233.189.104|:80... connected. HTTP request sent, awaiting response... 302 Found Location: http://www.google.com.my/ [following] --2009-07-19 14:07:27-- http://www.google.com.my/ Resolving www.google.com.my... 64.233.189.147 Connecting to www.google.com.my|64.233.189.147|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] Saving to: `www.google.com.my/index.html' [ <=> ] 5,742 --.-K/s in 0.05s 2009-07-19 14:07:27 (102 KB/s) - `www.google.com.my/index.html' saved [5742] FINISHED --2009-07-19 14:07:27-- Downloaded: 1 files, 5.6K in 0.05s (102 KB/s) Converting www.google.com.my/index.html... 0-12 Converted 1 files in 0.001 seconds.
La commande ci-dessus télécharge le site Web «google.com» sur notre disque local.
Explication des options de Wget
-r, –recursive spécifie le téléchargement récursif.
-k, –convert-links fait que les liens dans le HTML téléchargé pointent vers des fichiers locaux.
-p, –page-requisites récupère toutes les images, etc. nécessaire pour afficher la page HTML.
-E, –html-extension enregistre les documents HTML avec l'extension `.html '.
Il existe encore de nombreuses options utiles dans wget, veuillez lancerman wget ouwget –help pour en savoir plus sur les autres options.