2009-07-22 76 views
1

我正在尝试将任何页面的源代码加载到仅用于客户端的HTML编辑器的文本框中。我需要能够获取网页的整个来源,而不仅仅是身体。这YQL查询返回只是身体:有没有办法使用yql获取整个页面的源代码?

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22 

有没有什么办法让整个源,或是否有任何其他自由JSON-P-X Web服务,可以?

回答

1

我没有看到用YQL做这件事的显而易见的方式,但是这里似乎是一种雅虎管道。它拒绝让由他们的robots.txt的允许的网站,但它是为获得其他网站的整个源:

http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA

默认设置为www.example.com,这是因为被拒绝该页面上的robots.txt。但是,它接受URL作为参数。下面是该管道将得到pipes.yahoo.com源并返回结果包裹在JSON的例子使用的链接:

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

这是否帮助?

+0

更接近。该管道似乎过滤掉所有元标记和脚本标记。是否有任何代理/ web服务会返回整个页面? – Craig 2009-07-22 19:00:42

相关问题