他们是否使用php页面来分析链接,并将所有图像返回为josn? 有没有一种方法可以用JavaScript来做到这一点,所以你不必去服务器来分析页面?facebook/digg如何获取网页的所有内容?
1
A
回答
0
我现在没有如何他们做到这一点。我会为此目的实施一项小型服务。给定一个URL返回一些相关的图像(或生成一个截图)。该服务还可以缓存结果以获得更好的性能。但仍然需要访问该页面才能获取<img src=...
或拍摄照片。
0
Facebook回电给服务器。如果您使用Firebug(或者像我一样,使用Safari中的Web Inspector),则可以检查ajax调用。 Facebook在/ajax/composer/attachment.php处回调脚本 - 其中包含一些包含插入到页面中的HTML的JavaScript。这是个什么样子,如果我点了Facebook的连接链路对话的BBC新闻网页在Safari Web检查:
我把全部的JavaScript响应上Gist(这是所有单行和精缩原来,所以我只是通过TextMate来包装它)。
我不确定你是否可以在客户端做到这一点 - 因为跨站脚本的浏览器保护 - 即使你可以,你可能也不应该因为这个潜在的安全问题:假设如果有人放入一个指向只有他们有权访问的页面的URL。您不一定要将别人的自定义页面或私人页面放在您的Facebook/Digg类型网站上。想象一下,如果它是像Flickr一样的东西,并且有私人照片 - 或者更糟糕的话,是一个色情网站。不,最好将它代理回服务器,然后抓取图像。另外,它可能会更快。当您的服务器可能会更快地执行操作时,无需为最终用户的潜在缓慢连接下载页面; ...
相关问题
- 1. python如何获取网页的所有内容动态
- 2. 如何获取HTTPS网页的内容?
- 3. 如何获取网页内容(android)?
- 4. 获取网页内容
- 5. 如何从Scrapy中提取网页中的所有内容
- 6. 如何在访问该网页之前获取网页内容
- 7. 获取网页的内容,并比较
- 8. “所有网站内容”权限页面
- 9. Javascript:如何获取网址的内容?
- 10. 如何获取网页的元标记的内容
- 11. 使用LWP获取网页内容
- 12. 从silverlight获取网页内容?
- 13. Javascript获取网页内容到阵列
- 14. 阅读网页内容,获取异常
- 15. SharePoint如何获取所有子网站,子网站列表和列表内容
- 16. 如何获取网页以显示任何屏幕尺寸内的所有内容?
- 17. 获取所有桶的内容对象
- 18. 如何获取shell变量中网页的内容?
- 19. 如何在Java中获取网页的全部内容?
- 20. C#中,如何获取网页的内容?
- 21. 如何获取所选内容的HTML标记内的所有内容asp.net代码隐藏内容
- 22. 获取重定向到另一个网页的网页内容
- 23. 按内容类型获取网站集中的所有文件
- 24. 如何获取网络资源内容?
- 25. 如何从XUL获取内容页面?
- 26. 如何从PAMIE获取页面内容?
- 27. Viewpager:如果网页遭到移除接下来的几页内容获取的内容已删除的网页
- 28. 如何在没有CURL的情况下获取网页的内容?
- 29. 如何使用TCPDump获取网页内容?
- 30. 如何使用java获取动态网页内容?