我想知道是否有一个库或Python中的某些方法从HTML文档中提取元素。例如:在Python中删除HTML块
我有这个文件:
<html>
<head>
...
</head>
<body>
<div>
...
</div>
</body>
</html>
我想从文件块内容一起删除<div></div>
标签块,然后它会是这样的:
<html>
<head>
...
</head>
<body>
</body>
</html>
你想只删除''
标签或这两个标签和内容的内容? –我想删除它们之间的标签和内容。但是只有内容是好的:) – JefersonM
你可以尝试读取html文件作为xml并删除'div'节点。 https://wiki.python.org/moin/PythonXml建议使用* ElementTree * –