Boa tarde ubunteiros de bom coração!
Na noite passada eu descobri as delícias do
wget, a ferramenta de download não interativa que permite baixar arquivos grandes e até mesmo espelhar sites inteiros localmente. Surgiu uma dúvida quanto a seu uso que eu ainda não solucionei.
Supomos que eu queira, por exemplo, salvar uma galeria de imagens que está no site. São vários albums que estão no formato
http://url.do.site/diretorio_de_albuns/album_xyz/foto.jpgEu, preguiçoso e cretino, quero salvar tudo que está em todos os albuns. Pela lógica eu tentei usar
wget -r -A=jpg,jpeg,gif http://url.do.site/diretorio_de_albuns/
(salvar recursivamente tudo que está no diretorio_de_albuns e subdiretórios, aceitando apenas arquivos do tipo imagem)
Agora, o problema: não funcionou. Ele salvou UM MONTE de lixo, html, páginas e consultas php... como me livro disto? Por exemplo, ele salvou arquivos do tipo
arquivo.php?variavel=valorAgora, abusando ainda mais da boa vontade dos senhores.
Existem nos diretórios arquivos de nome thumb_***.jpg, que são thumbnails. Como posso ignorá-los usando a opção --reject? É possível?
Obrigado desde já por toda e qualquer ajuda ;-)