我有大表(〜1,000,000行),可能包含重复的值。删除大表中的重复行
该表包含两列(例如col a,col b),它们共同表示唯一键,ID和最后更新日期。
例如我可以有如下表格:
id | a | b |更新
1 | jon |史密斯| 1/1
2 | don |史密斯| 2/5
3 | bob |大卫| 1/1
4 | dan |刘易斯| 3/1
5 | bob |大卫| 3/1
正如您可以看到id 3和5那样,该表在a列和b列中都包含相同的值。 我想删除包含这种重复的行,但保留最后一次更新的行。
对于这个例子,我将在删除后有这张表: id | a | b |更新
1 | jon |史密斯| 1/1
2 | don |史密斯| 2/5
4 | dan |刘易斯| 3/1
5 | bob |戴维斯| 3/1
(ID = 3删除,因为我已经有一个摆锤=和b =戴维斯在行其中id = 5,该行中的更新是高于所述一个被删除的行中)
一个自我引用应该是足够的,因为最新的更新的不平等就足以阻止行从与自身匹配起来。 – dasblinkenlight
你说得对,dasblinkenlight。在这样的大型桌面上,性能增益会很大。荣誉。 ;) –