我不想知道如何解决这个问题,因为我自己解决了这个问题。我只是问它是否真的是一个错误,以及我是否和如何报告它。 可以找到的代码和下面的输出:HTMLParser误解了href中的实体。这是一个错误还是不是?我应该报告吗?
from html.parser import HTMLParser
class MyParser(HTMLParser):
def handle_starttag(self, tag, attrs):
for at in attrs:
if at[0] == 'href':
print(at[1])
return super().handle_starttag(tag, attrs)
def handle_data(self, data):
return super().handle_data(data)
def handle_endtag(self, tag):
return super().handle_endtag(tag)
s = '<a href="/home?ID=123>3=7">nomeLink</a>'
p = MyParser()
p.feed(s)
以下是输出:
“?/家ID = 123> 3 = 7”
HTML格式错误;而'&'应该转义为'&'。解析器正在尽全力修复损坏。 – 2014-09-27 09:09:07