2012-04-16 75 views
0

我有两个HTML页面,其中页面的内容是列1和列2。列1在两页中具有相同的数据,而列2不同(将列2视为计数器值)。如何比较这两个页面比较防火墙后面的两个HTML页面

选项,我有:

1)使用的工具,我用(了SoapUI而定)写剧本,并分析每个HTML页面 2)使用一些内置的可用于Java库/ Perl/Python

我正在寻找像quickdiff.com这样的方式。

注意:html页面被防火墙挡住,无法通过互联网上的公共含义差异工具访问。这两个html页面是来自同一网站的实例。

任何关于如何解决这个问题的指针?

感谢

编辑:正如我所提到的,html页面包含两列,其中第一列是在两个页面和列2同样是一个计数器的值。如果COLUMN1是有值“a”和COLUMN2是1,那么column1也是“a”,column2是第2页中的2,这些将被diff命令认为是不同的。我想把它们看成是一样的。换句话说忽略列2只看到在列1

+0

u能请加入更多的描述,不知道如果我跟着?可能会作为答案? – SuperMan 2012-04-16 02:52:04

回答

0

差异,您可以使用wgetdiff以示区别:

diff <(wget -q -O - http://www.site1.com/) <(wget -q -O - http://www.site2.com/) 
+0

问题是网页是服务器名称的形式,wget仍然可以用于这样的一些URI ?我想我会尝试你的建议 – SuperMan 2012-04-16 02:58:38

+0

是的,它[支持](http://www.gnu.org/software/wget/manual/wget.html#URL-Format)任何[有效的URL](http:// www .ietf.org/RFC/rfc1738.txt)。 – 2012-04-16 03:02:23

+0

Beau - 正如我所提到的,html页面包含两列,其中列1在两个页面中相同,而列2是计数器。如果列1的值为“a”,列1在第1页中为1,那么列1也是“a”第2页中的第2列是2,这些将被diff命令认为是不同的。我想把它们看成是一样的。换句话说,忽略column2,只能看到column1中的差异,这是否有意义? – SuperMan 2012-04-16 04:59:56

相关问题