2012-03-29 56 views
0

通过Web浏览器,我可以通过访问一个网址查看鸣叫页面像为什么不能通过“http-get”请求下载推文的网页?

http://twitter.com/#!/[user-name]/status/[long-integer]

,但我不能获得通过unix命令“wget的”正确的页面内容。相反,我得到Twitter.com的欢迎页面。 Twitter.com如何通过浏览器区分命令行“获取”请求和请求?谢谢。


虽然我试图找出问题的原因,但其他人却试图找到问题的解决方案。 =>Navigating/scraping hashbang links with javascript (phantomjs)

+1

#blah是完全客户端。它用于滚动到页面上的锚点,尽管有些网站使用它来控制AJAX请求。该技术有一个名称,但我不记得它...将发布它,如果我找到它。 – Corbin 2012-03-29 00:59:32

+0

有没有通过编码来模拟客户端行为的方法? – Ning 2012-03-29 01:10:22

+2

不容易。这基本上需要在代码中创建一个JavaScript解析器。但是,twitter可能有一个API。 – Corbin 2012-03-29 01:13:20

回答