viernes, 10 de julio de 2009

Descarga de un sitio entero con wget

Para empezar un poco de teoría... wget es un comando que sirve para descargar archivos vía http, ftp mediante la consola eliminando el uso del navegador web o un gestor de descargas. Tiene una GUI que es gwget, pero ese no es el punto, sino más bien que puedes descargarte un sitio de web entero mediante estos comandos:

wget -r -p http://www.ejemplo.com

o bien podemos añadirle un poco mas a esa linea como esto:

wget --random-wait -r -p -U mozilla http://www.ejemplo.com

veamos un poco la razón de ser de cada comando: –random-wait, hace que la descarga de contenido sea aleatoria, pues muchos sitios cuando observan descargas múltiples y masivas de ficheros, limitan la descarga o la cortan.
-U mozilla, permite engañar al sitio online haciéndoles creer que somos un navegador convencional, en muchos otros casos estos sitios al no detectar un browser valido impiden la descarga.
pues yo ya lo probé y les dejo un pantallazo en donde estoy descargando mi propio blog

gracias a ubuntulife por el truco

No hay comentarios:

Publicar un comentario