Para baixar um conteúdo de sites inteiros, existe o comando Wget. Com este comando é possível baixar conteúdos de sites inteiros. Veja:
wget -r www.siteaserbaixado.com.br
Se quer baixar conteúdos omitidos pelo autor do site, através de robots, use este comando:
wget -r -e robots=off www.siteaserbaixado.com.br
Vale lembrar que o comando wget ( na verdade um programa) só funciona em sistemas operacionais Unix-like como Linux, Mac OsX, Solaris e etc e só é possível acessar por meio de linha de comando, ou seja, em modo texto. No Windows, você tem que baixar este programa em separado no site do Wget para Windows.
Agora para aqueles que acessavam sites como Cia de Ônibus, que foi retirado do ar recentemente ou mesmo matar saudades de sites de rádios extintas como Antena 1 Rio e de sites eletrônica como Eletricazine, seus problemas acabaram. Com o site Web Archive você pode acessar aquele site que saiu do ar e que você não encontra em lugar nenhum. Portanto, não há porque se preocupar ser um site sair do ar ou mesmo quando precisar do conteúdo de um site existente ou extinto. O programa Wget e o site Web Archive resolvem o seu problema. E só!
Web Archive - Endereço do site de recuperação de sites extintos Web Archive.
Wget - Tutorial do site Viva o Linux onde explica como usar o Wget.
ou
Wget - Outro tutorial explicando como usar Wget.
Wget para Windows - Site onde pode ser baixada a versão do Wget para o Windows.
Nenhum comentário:
Postar um comentário