在我目前的应用程序中,我需要能够做这种类型的查询:SQL:元组比较
SELECT MIN((colA, colB, colC))
FROM mytable
WHERE (colA, colB, colC) BETWEEN (200, 'B', 'C') AND (1000, 'E', 'F')
,并得到(333, 'B', 'B')
答案,给出这样的数据:
+------+------+------+
| colA | colB | colC |
+------+------+------+
| 99 | A | A |
| 200 | A | Z |
| 200 | B | B |
| 333 | B | B |
| 333 | C | D |
| 333 | C | E |
| 333 | D | C |
| 1000 | E | G |
| 1000 | F | A |
+------+------+------+
什么是在真正的SQL中完成这项工作的最有效方法?请记住,这是一个玩具的例子,而且我的实际应用程序具有不同列和数据类型的表格,以及数以亿计的行。如果有帮助,我使用MySQL。您还可以假设这些列对其有一个PRIMARY或UNIQUE索引。
如果解决方案可以轻松扩展到更多/更少的列,那就更好了。
几个都问,所以我应该把这个问题:
元组比较。元组按照字典顺序排列,这意味着序列的顺序与它们的第一个不同元素相同。例如,(1,2,x)<(1,2,y)返回与x < y相同的值。
值得一提的是,SQL(或至少MySQL的)实现了这个正确:
mysql> select (200, 'B', 'C') < (333, 'B', 'B') and (333, 'B', 'B') < (1000, 'E', 'F');
+--------------------------------------------------------------------------+
| (200, 'B', 'C') < (333, 'B', 'B') and (333, 'B', 'B') < (1000, 'E', 'F') |
+--------------------------------------------------------------------------+
| 1 |
+--------------------------------------------------------------------------+
1 row in set (0.00 sec)
这里是必要的SQL创建的例子:
create table mytable select 333 colA, 'B' colB, 'B' colC;
insert into mytable values (200, 'B', 'B'), (333, 'C', 'D'), (1000, 'E', 'G'),
(200, 'A', 'Z'), (1000, 'F', 'A'), (333, 'C', 'E'), (333, 'D', 'C'),
(99, 'A', 'A');
alter table mytable add unique index myindex (colA, colB, colC);
添加该指数似乎导致表按字典顺序排序,这很有趣。我们的生产系统并不是这样。
你是如何定义的元组排序? – 2011-03-31 21:52:43
对于记录来说,'('B','K','K')'不会使'BETWEEN'条件成为行,对吧? – 2011-03-31 22:09:11
@ypercube:是的。 (B,K,K)在(A,B,C)和(D,E,F)之间排序 – bukzor 2011-03-31 22:16:47