2011-05-13 56 views
0

这个问题有点类似this之一,但更具体。我想通过获取两个转储文件中差异的可视化来测试ETL过程。转储文件包含整个数据库。这些差异不会在模式上进行,因为这样的比较很容易手动进行,而只是数据上的细微差别。用于比较转储文件中数据的任何工具?

有没有工具可以做到这一点?我想象的可视化可能是这样的:

Column1在10行中有0.02%的差异。

它当然也应该可以详细查看每一行的实际差异。

是否存在这样的工具。

回答

1

文本工具通常是您最好的选择。

但是,如果我正在测试一个ETL过程,我不想一次测试整个转储。 (在我的情况下,这将是数百万行。)我宁愿自动将每个表转储到一个单独的文件。然后很容易判断表格中两个版本的数据是否相同。

cmp table.old table.new 

cmp如果文件相同,则不产生输出。 diff会告诉你差异在哪里。

diff table.old table.new 

我使用Cygwin当我必须在Windows下做这个东西。