这更多的是试图了解HTTP如何工作然后实现它的问题。如何分离背景HTTP请求
我需要一个HTTP分析器,它能够将主页面请求和来自某些HTTP日志数据的“背景”请求分开。这个想法是将用户发出的HTTP请求与后台自动发生的请求(松散地使用这个术语)分开。因此,从我看到的HTTP数据的前几个印象看来,似乎当我访问任何普通网站时,会获取文本/ html对象,然后是很多其他对象,如css,xml,javascript,图像等。
现在,问题是如何区分这些“背景”请求,其中用户主动不生成请求。这主要取决于我所知道的广告提取,重定向和一些基于Ajax的事情。
有没有人对此有任何意见。一些,经验或可能是您可以指示我开始进行此分析的资源?
我觉得平时(最简单的)方式是文件类型将它们分开:'html','PHP '等请求是真正的命中,'css','js',图像文件等是“背景”命中。当然,这不包含Ajax请求,它也可能会遇到'html'和'php'文件。 – Wukerplank 2011-03-04 09:52:13