我想解析从外部源获得的XML文件,但由于文本节点中存在未编码的XML实体,所以出现问题。 本质上,我提出了与this相同的问题,但对于Perl而不是PHP。 <report>
<company>A & W</company>
<company>Some Other Company with a < in Inc.</company>
</report>
我试图用这样的:
如何使用Nokogiri与html实体(如德语变音符号)不变? 即: # this is fine
node = Nokogiri::HTML.fragment('<p>ö</p>')
node.to_s # => '<p>ö</p>'
# this is not
node = Nokogiri::HTML.fragment('<p>ö</p>')
node.to_