1
我正在使用lxml.html解析html内容。但我不明白为什么lxml会丢弃“body”标签属性。 尝试使用lxml.html.parse和lxml.html.document_fromstring建议herelxml.html忽略正文类属性
但仍然无法正常工作。
例HTML字符串: -
<html class="hello"> <head> <iframe src="index.html"></iframe> </head> <body class="foo"><h1>a</h1></body> </html>
别人是否也面临这个问题?