Conteúdo README do repo que acabei de criar:
tumblr-pics-downloader
Ele irá baixar todos os arquivos jpg, jpeg, png, gif para a pasta de destino.
É muito rápido por causa da paralelização.
O downloader é baseado no Tumblr_scrape de David Shaw .
Verifique o código dele e compare com o meu para ver quais são as mudanças.
Diferenças da versão original:
- velocidade . Eu não medi, mas usar 10 fios torna cerca de 8 vezes mais rápido. O aumento adicional de threads não trouxe nada, mas você pode testar você mesmo.
- número de formatos de imagem suportados também é estendido de | jpg e png | para | jpg, jpeg, png e gif |. Pode-se adicionar mais formatos facilmente alterando regexp em 2 lugares.
- código refatorado um pouco (se ficou melhor ou não é para você julgar)
Exemplo de uso:
vá para o prompt de comando e digite algo assim:
ruby tumblr_pics_downloader.rb http://best-of-tumblr.tumblr.com
Algumas das coisas que ainda vou mudar incluem:
- adicione outros sites para que você possa obter fotos não apenas do tumblr, mas, digamos, também do mmm-tasty.ru . Se eu fosse um regexp profissional, isso já estaria feito 🙂
- use trollop em vez de analisar argumentos manualmente (para um script tão simples talvez não haja necessidade, só quero brincar um pouco)
- salve o texto se necessário (ainda pensando se algum dia vou precisar dele)
Se você gostou da ideia e quer que eu melhore ainda mais o código, me avise pressionando o botão.
Quaisquer sugestões são bem-vindas.
Especialmente críticas de programadores Ruby
(de que outra forma eu vou aprender sem o seu feedback?)