2014-08-28 137 views
1

我在策略表中有策略信息。每行代表特定时间的策略状态(时间存储在updated_on列中)。每行都属于策略迭代(多个策略行可以属于单个策略迭代)。我想查看一个策略迭代中行与行之间的状态变化。将以前的行子查询转换为MySQL中的连接

的策略表:

CREATE TABLE `policy` (
    `policy_id` int(11) unsigned NOT NULL AUTO_INCREMENT, 
    `policy_iteration_id` int(10) unsigned NOT NULL, 
    `policy_status_id` tinyint(3) unsigned NOT NULL, 
    `updated_on` datetime NOT NULL, 
    PRIMARY KEY (`policy_id`), 
    KEY `policy_iteration_idx` (`policy_iteration_id`), 
    KEY `policy_status_updated_idx` (`policy_status_id`,`updated_on`) 
) ENGINE=InnoDB DEFAULT CHARSET=latin1; 

我希望能够传递一个日期范围和“从”状态和“到”的状态,并为“到”行返回策略数据。因此,在伪代码中,我需要按策略迭代进行分组,查找满足数据范围和“到”状态的行,然后查看该策略迭代中的上一行,以查看它是否具有“from”状态。如果是,请返回“到”行的信息。

这是我想出了查询:

SELECT 
    pto.policy_iteration_id, 
    pto.policy_id, 
    pto.updated_on, 
FROM 
    policy AS pto 
WHERE 
    pto.updated_on >= $from_date AND 
    pto.updated_on <= $to_date AND 
    pto.policy_status_id = $to_status_id AND 
    $from_status_id = 
    (SELECT 
     pfrom.policy_status_id 
    FROM 
     policy AS pfrom 
    WHERE 
     pfrom.policy_iteration_id = pto.policy_iteration_id AND 
     pfrom.policy_id < pto.policy_id 
    ORDER BY 
     pfrom.policy_id DESC 
    LIMIT 
     1); 

这个查询工作,但其原因在于每一行要执行的子查询的效率非常低。我想通过使用子查询连接来提高效率,但我无法弄清楚。

任何帮助,将不胜感激。谢谢!

更新#1

为了帮助解释什么,我试图做的,这里是一个示例数据集中:

+-----------+---------------------+------------------+---------------------+ 
| policy_id | policy_iteration_id | policy_status_id | updated_on   | 
+-----------+---------------------+------------------+---------------------+ 
| 323705 |    27230 |    6 | 2014-08-01 10:27:11 | 
| 325028 |    27230 |    2 | 2014-08-01 17:12:28 | 
| 323999 |    27591 |    2 | 2014-08-01 12:07:31 | 
| 324008 |    27591 |    6 | 2014-08-01 12:10:23 | 
| 325909 |    27591 |    2 | 2014-08-02 14:59:12 | 
| 327116 |    29083 |    6 | 2014-08-04 12:09:16 | 
| 327142 |    29083 |    6 | 2014-08-04 12:19:00 | 
| 328067 |    29083 |    2 | 2014-08-04 17:58:41 | 
| 327740 |    29666 |    3 | 2014-08-04 16:16:55 | 
| 327749 |    29666 |    3 | 2014-08-04 16:19:01 | 
+-----------+---------------------+------------------+---------------------+ 

现在,如果我运行查询,其中FROM_DATE =“2014-08- 02 00:00:00' ,TO_DATE = '2014年8月5日00:00:00',from_status = 6和to_status = 2时,结果应该是:

+-----------+---------------------+------------------+---------------------+ 
| policy_id | policy_iteration_id | policy_status_id | updated_on   | 
+-----------+---------------------+------------------+---------------------+ 
| 325909 |    27591 |    2 | 2014-08-02 14:59:12 | 
| 328067 |    29083 |    2 | 2014-08-04 17:58:41 | 
+-----------+---------------------+------------------+---------------------+ 

这两行具有与行在规定的时间段内所选的“to_status”为2并且其前一行的“from_status”为6.

我不相信用policy_iteration_id的GROUP BY加入MAX策略ID将执行该任务,因为那样会返回最近的行,而不是具有“to_status”的行之前的行。

任何进一步的帮助,将不胜感激。谢谢!

回答

1

您可以使用max from.policy_id where from.policy_id < to.policy_id来帮助获取上一行作为集合。

select 
     p.policy_iteration_id, 
     p.policy_id, 
     p.updated_on 
from 
    policy f 
     inner join (
    select 
     p.policy_iteration_id, 
     p.policy_id, 
     p.updated_on, 
     max(f.policy_id) as prev_policy_id 
    from 
     policy p 
      inner join 
     policy f 
      on f.policy_iteration_id = p.policy_iteration_id and 
       f.policy_id < p.policy_id 
    where 
     p.updated_on >= $from_date and 
     p.updated_on <= $to_date and 
     p.policy_status_id = $to_status_id 
    group by 
     p.policy_iteration_id, 
     p.policy_id, 
     p.updated_on 
) p 
     on p.prev_policy_id = f.policy_id 
where 
    f.policy_status_id = $from_status_id 

在具有窗口函数的数据库中,实现此目的有更简单的方法。

Example SQLFiddle

+0

+1用于窗口功能。 – paqogomez 2014-08-28 22:29:19

+0

不仅窗口功能; IIUC直接加入自己就足够了。 – wildplasser 2014-08-28 22:57:12

+0

@wildplasser http://sqlfiddle.com/#!2/b0e9bf/6有一个以前的(现在删除的)解决方案使用自加入,OPs解决方案和我的。你能纠正自己的加入吗? – Laurence 2014-08-28 23:23:38