我很新,正则表达式。基本上,我想使用正则表达式使用正则表达式从字符串中删除<sup> ... </sup>
。在Python中删除html标记和字符串
输入:
<b>something here</b><sup>1</sup><sup>,3</sup>, another here<sup>1</sup>
输出:
<b>something here</b>, another here
是,在如何做到这一点的简便方法和说明?
note这个问题可能会被重复。我试过但找不到解决方案。
正则表达式不是处理html的方式,使用html解析器。 html不是一个简单的字符串,它是结构化数据。最容易使用的是beautifulsoup,但它只是一个更高效的库的包装,你也可以使用它。 –
我有像上面那样的短字符串列表。我想使用正则表达式将无需使用HTML解析器 – titipata