Hojeando un poco el libro Core Python Aplications programming me encontre con esta familiar funcion : urlparse.urlparse que en si lo unico que hace es separar una url en basicamente 4 partes : scheme, netloc, path y query.
scheme es el protocolo con el que se esta tratando, sea http, ftp ... etc.
netloc es el hosting o dominio de la direccion (url)
path es la direccion relativa al dominio, las carpetas y el archivo final
query son los parametros con los que viaja la url
ejemplo :
import urlparse myurl = "http://fiesta.com/archivos/busqueda.php?lugar=playa&hora=tarde"; parsedurl = urlparse.urlparse(myurl) print parsedurl.scheme # http print parsedurl.netloc # www.fiesta.com print parsedurl.path # /archivos/busqueda.php print parsedurl.query # lugar=playa&hora=tarde