Oggi parliamo di una libreria stupenda che si chiama BeautifulSoup questa stupenda libreria ci aiuterà a leggere la nostra pagina html.
Per scaricare questa stupenda libreria basta andare qui.
Ora passiamo subito al codice.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
#Includo le librerie from bs4 import BeautifulSoup import urllib #Apro il link html = urllib.urlopen('http://codematrix.altervista.org') #Creo Oggetto beutifulSoup codematrix = BeautifulSoup(html.read(),'html') #Stampa tutto il tag title print(codematrix.title) #Esempio come cercare un determinato tag nella nostra pagina web meta_tags = codematrix.find_all('meta') #Vediamo quanti meta tags ci sono print len(meta_tags) #Stampiamo solamente il primo print meta_tags[0] |
In conclusione posso dire che una stupenda libreria è perfetta per interfacciamento con pagine web con cui possiamo creare programmi che automatizzano alcune operazioni che di solito vengono fatte manualmente.