2012-04-02 106 views
1

有这么多的公共网站正在运行,它们在其网站的某种框架中显示整个网站。 例如: - 查看代理网站,其中有框架和我们输入网址的框。输入URL后,这些网站将获取整个html页面并在其框中呈现。我想了解他们如何执行此操作。他们不是面对XSS的问题吗?请帮我理解和学习。 :)如何从其他网站获取内容

+0

一个你可以检查出的例子是http://zend2.com – 2012-04-02 07:12:13

回答

3

首先,你不应该刮别人的网站,并显示在你自己的iframe中。

可以提取网址using a tool called cURL

的全部内容。如果你可以在Java代码中使用Apache HTTPClient library

+0

它不是我会抓取其他人的网站,但我想创建一种平台,人们可以实时打开自己的网站,并尝试修改它们,并检查它看起来如何。那么我知道我没有做错:) :)感谢您的回应btw – 2012-04-02 07:04:44

+0

其实我想用javascript或jquery编写代码我也发现了一个库@ http://james.padolsey.com/javascript/cross-domain -requests-with-jquery/ 我现在正在尝试这一个,如果问题仍然存在,它会变成你提供的cURL解决方案 – 2012-04-02 07:07:45

0

你可以尝试,例如,在python urllib模块刮取网站的网址,但要小心你不应该做的事情。始终注意条款和条件。请记住,拥有巨大的权力是非常重要的。

0

针对跨站点脚本(XSS)的限制仅与JavaScript有关。问题是没有限制,可以将任意可执行代码注入到您的网站中。将其他网站的内容链接到您的网站有很多种方法。这个想法是WWW背后的基本思想之一。
许多可能性之一是他们正在使用Framing,例如iframes:<iframe src="someone-elses-website.com">

+0

感谢保罗..我会在一段时间内检查它..再次感谢 – 2012-04-02 07:09:14

+0

保罗伊夫拉克的事情是行不通的。我已经尝试过了,并且出现以下错误:拒绝显示文档,因为X-Frame-Options禁止显示。我不知道为什么会发生这种情况.. – 2012-04-02 08:32:02