2010-04-09 43 views

回答

1

为了突出显示html页面文本的变化,我使用了xdiff。其基本流程是:

  1. 逃避所有的HTML实体
  2. 分裂HTML标签到他们自己的线路(附加\ n关闭>后)
  3. 劈在空白结果文本(消除重复空格)
  4. 归队以前的分裂与\ n作为分隔符的结果,所以现在所有的标签和文字都在单独的行
  5. 做DIFF与xdiff_string_diff()
  6. 修补的diff输出的突出ADDIT离子/缺失与适当的标签

不是特别有效,而且非常头重脚轻的额外包装标签,如果你有广告/缺失的长序列,但它做的工作。

+0

嗯,我一定会试试这个。这似乎是一个很好的创造性的解决方案,可以肯定地解决我的问题。感谢发布。 – 2010-04-12 04:41:11

相关问题