Il sito xkcd e una raccolta di fumetti online con questo script e possibile scaricare tutti i fumetti presenti sul sito premetto che questo script non è mio lo trovato al seguente link.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
import urllib, os, re dl_folder = "./" print 'Cerca ultimo fumetto' for line in urllib.urlopen(r'http://www.xkcd.com/').readlines(): lastcomic = re.search(r'http://xkcd.com/(\d*?)/',line) if lastcomic: lastcomic = int(lastcomic.group(1)) print 'Ultimo Fumetto: '+<code>lastcomic break print('Spingi CTRL-C per terminare il programma.\n\n') try: for comic in xrange(1,lastcomic+1): for line in urllib.urlopen(r'http://www.xkcd.com/'+<code>comic</code>).readlines(): img = re.search(r'(http://imgs.xkcd.com/comics/.*?(?:png|jpg))">?.*? title="(.*?)"',line) if img: dl_path = os.path.join(dl_folder,(4-len(<code>comic</code>))*'0'+<code>comic</code>+'.jpg') if not os.path.isfile(dl_path): urllib.urlretrieve(img.group(1),dl_path) print 'Fumetto '+<code>comic</code>+' Scaricato' else: print 'Fumetto '+<code>comic</code>+' gia trovato nella cartella. Scaricamento saltato' break else: print ('Scaricamento del fumetto'+<code>comic</code>+' senza successo','Errore 404 (File saltato)')[comic==404] except KeyboardInterrupt: print 'Programma Terminato' |