2012-08-13 48 views
0

我正在尝试使用YQL解析页面。正在解析HTML表格。问题在于YQL本身添加了HTML“p”标签,而不包含在原始HTML中。应该做什么,以便YQL不应该返回HTML。JSON和XML的YQL解析问题

The YQL query can be seen here

如果在下面的td标签中查找,则会出现一个p标签,其中包含原始html中可以看到的内容here在表html中没有p标签。

<tr> 
    <td class="ttl"> 
     <a href="#" onclick="helpW('h_weight.htm');">Weight</a> 
    </td> 
    <td class="nfo"> 
     <p>169 g</p> 
    </td> 
</tr> 
+0

请按下测试按钮在YQL控制台中运行YQL查询。谢谢! – 2012-08-13 17:46:20

回答

0

这不是YQL这样做,而是HTML5引擎本身。 HTML5的部分理念是,如果你给它提供了无效的HTML,它会通过添加任何你错过的元素来为你修复它,并且你在查询中看到的是代表修复内容的树。 (是的,这很难写查询,但这不是一个分摊责任的地方......)