sábado, 29 de septiembre de 2012

UrlParse en python



Hojeando un poco el libro Core Python Aplications programming me encontre con esta familiar funcion : urlparse.urlparse que en si lo unico que hace es separar una url en basicamente 4 partes : scheme, netloc, path y query.

scheme es el protocolo con el que se esta tratando, sea http, ftp ... etc.
netloc es el hosting o dominio de la direccion (url)
path es la direccion relativa al dominio, las carpetas y el archivo final
query son los parametros con los que viaja la url

ejemplo :

import urlparse
myurl = "http://fiesta.com/archivos/busqueda.php?lugar=playa&hora=tarde";
parsedurl = urlparse.urlparse(myurl)

print parsedurl.scheme  # http
print parsedurl.netloc  # www.fiesta.com
print parsedurl.path    # /archivos/busqueda.php
print parsedurl.query   # lugar=playa&hora=tarde