2013-02-20 41 views
1

目前这仅仅是一个技术挑战,但基本上我想做到以下几点:使用带有Apache的mod_proxy处理HTML,例如去除广告

创建使用mod_proxymod_proxy_html一个基于Web的反向(网关)的代理,它不仅改写HTML的URL匹配代理的主机名,但也重写或操纵正在代理的HTML。

该操作的“中间人”网关代理将允许人们做各种事情,如:

  • 删除广告
  • 从一种语言文字翻译成另一种
  • 否则破解或“改善”原始网站

当然,它也可能用于很多不好的事情,但这超出了本文的范围estion。

我知道mod_proxy_html分析原始的HTML重写所有的网址,但它也让我写我自己的代码,将评估和操纵正在被解析的HTML?还是有其他模块呢?

另外,是否有反向代理可用,可以做到这一点?我愿意适应任何适合此目的的语言。

回答

1

通过使用mod_rewritemod_proxy_html您可能可以做到这一点。

这些模块可以让你可能已经知道重写/美化网址。相反,改变网页,这不是阿帕奇的作用内容的,你可以改变它们的结构所以在接收到网页中的链接看起来像:

10.10.1.1/my_secret_injector/alter?url=<the_real_url> 

而不是仅仅<the_real_url>

然后在指定的网络服务器(10.10.1.1)上实施您的广告删除算法或任何您选择的语言。

相关问题