我试图打开并处理mht文件并刮掉经销商位置数据。每当我遇到一个HTML格式“棘手”的网站时,我总是会遇到同样的问题。事实证明:在mht文件中替换 n
A HREF = “http://www.google.com/maps?s=123主要ST” ......
到
a href="http://www.=
google.com/maps?=12=
3 main st"
什么我有迄今为止尝试过没有努力把这条线带回原来的自我。我仍然无法将地址关闭。
a = a.replace(r'=\n', '')
或
a = a.replace(r'\n', '')
甚至试过,
a = a.replace(r'[0D]', '')
和刚刚试过,
a = a.sub(r'\n', '')
和所有我得到的是错误“海峡对象没有属性'sub',它有或没有t做同样的事情他在代码中。
到目前为止没有任何工作。如何替换每当我去查看mht文件时始终弹出的= \ n。
我使用
a = open('Filename.mht', 'r')
b = a.read()
a.close()
你能告诉我们你用来获取mht文件的代码,以及如何打开它吗? –
我的答案是否适合你? –