从Python中删除URL中的utm_ *参数
发布时间:2020-09-06 05:28:07 所属栏目:Python 来源:互联网
导读:我一直在尝试从URL列表中删除所有utm_ *参数. 我发现的最接近的是: https://gist.github.com/626834. 有任何想法吗? 它有点长,但使用url *模块,并避免重复. from urllib import urlencodefrom urlparse import urlparse, parse_qs, urlunparseurl = http://
我一直在尝试从URL列表中删除所有utm_ *参数.
有任何想法吗? 解决方法它有点长,但使用url *模块,并避免重复.from urllib import urlencode from urlparse import urlparse,parse_qs,urlunparse url = 'http://whatever.com/somepage?utm_one=3&something=4&utm_two=5&utm_blank&something_else' parsed = urlparse(url) qd = parse_qs(parsed.query,keep_blank_values=True) filtered = dict( (k,v) for k,v in qd.iteritems() if not k.startswith('utm_')) newurl = urlunparse([ parsed.scheme,parsed.netloc,parsed.path,parsed.params,urlencode(filtered,doseq=True),# query string parsed.fragment ]) print newurl # 'http://whatever.com/somepage?something=4&something_else' (编辑:甘南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |