我在Python中使用xpath来解析HTML文件中的表。我使用这个XPath:什么是从文本()使用xpath去除东西的方式?
//td//text()
这给我输出两个字符串:
['australia', '$3333.99']
输出我想:
['australia', '3333.99']
,但我想剥离$符号如何我这样做一般使用xpath?我试过substring-after
但它不起作用。
这是我尝试:
//td//text()[substring-after(.,'$')]
,但我得到这样的输出:
['$3333.99']
Australia
从结果缺少
你试图表达的是显示在XPath 2.0中很好,但在XPath 1.0中没有。您应该指定您正在使用的XPath版本。虽然它没有做你想要的东西:尝试// td // text()/ substring-after(。,'$')' –