scrapy中的lxml模块在您尝试返回不包含'。'的内容时工作正常。字符使用text()函数,但是当它们包含'。'时如'11.14'查询返回' - '。如何解决这个问题?lxml xpath path/text()无法在'。'后返回值。出现在scrapy中
这里是我的代码:
stock_price = hxs.xpath('//td[@id="gt1"]//text()').extract()
目标HTML看起来像这样:
<td id="gt1" class="txtl green">11.14</td>
只有一个GT1和它总是返回
'-'
,而不是
'11.14'
为什么?源URL是http://quote.eastmoney.com/sz000001.html
尝试与其他数据源,只要文本字段包含'。',它将返回' - ',否则一切都很好。这是环境问题吗?
什么是源HTML和URL? –
@paultrmbrth补充说。 –
为什么你有// text()而不是'/ text()'? –